ДВУХФАКТОРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Ранее рассматривались методы оценки и анализа линейной регрессии y=f(x). Если случайная величина у может зависеть одновременно от двух и более переменных, возникает задача оценки и анализа множественной регрессии:
y=f(x1,x2,…,xk), (4.93)
где xj (j-1,2,…,k) –независимые переменные.
Рассмотрим в качестве примера [12] регрессию y=α+β1x1+ β2x2 для случая двух независимых переменных x1 и x2. Для большего числа переменных оценки могут быть получены по аналогии. Для данного случая коэффициенты в уравнении регрессии определяются следующим образом:
(4.94)
(4.95)
(4.96)
где (4.97)
(4.98)
(4.99)
(4.100)
Дисперсия, характеризующая разброс значений yi вокруг линии регрессии, равна:
(4.101)
Проверка значимости коэффициентов в уравнении регрессии (4.93) осуществляется по следующему алгоритму:
(4.102)
(4.103)
Статистика t имеет распределение Стьюдента с f=n-3 степенями свободы.
Если:
, (4.104)
то коэффициенты b1и b2 признаются значимыми.
Сама регрессия признается значимой, если:
, (4.105)
где - дисперсия значений yi, оцениваемая по дублируемым наблюдениям.
Для Fα используются степени свободы f1=n-3 и f2=m-1, где m – объем выборки, по которой производилась оценка . Табличные значения Fα определяются из соответствующей литературы, например [8].
Для большего числа независимых переменных расчеты и анализ множественной регрессии существенно усложняются. Однако, в настоящее время разработаны специальные методы планирования регрессионных экспериментов, позволяющие упростить расчет коэффициентов регрессии и сократить число необходимых экспериментов.
Дата добавления: 2018-11-25; просмотров: 651;