Оценка значимости уравнения множественной регрессии
Построение эмпирического уравнения регрессии является начальным этапом эконометрического анализа. Первое же построенное по выборке уравнение регрессии очень редко является удовлетворительным по тем или иным характеристикам. Поэтому следующей важнейшей задачей эконометрического анализа является проверка качества уравнения регрессии. В эконометрике принята устоявшаяся схема такой проверки.
Итак, проверка статистического качества оцененного уравнения регрессии проводится по следующим направлениям:
· проверка значимости уравнения регрессии;
· проверка статистической значимости коэффициентов уравнения регрессии;
· проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК).
Проверка значимости уравнения множественной регрессии, так же как и парной регрессии, осуществляется с помощью критерия Фишера. В данном случае (в отличие от парной регрессии) выдвигается нулевая гипотеза Н0 о том, что все коэффициенты регрессии равны нулю (b1=0, b2=0, … , bm=0). Критерий Фишера определяется по следующей формуле:
где Dфакт - факторная дисперсия, объясненная регрессией, на одну степень свободы; Dост- остаточная дисперсия на одну степень свободы; R2 - коэффициент множественной детерминации; т - число параметров при факторах х в уравнении регрессии (в парной линейной регрессии т = 1); п - число наблюдений.
Полученное значение F-критерия сравнивается с табличным при определенном уровне значимости. Если его фактическое значение больше табличного, тогда гипотеза Но о незначимости уравнения регрессии отвергается, и принимается альтернативная гипотеза о его статистической значимости.
С помощью критерия Фишера можно оценить значимость не только уравнения регрессии в целом, но и значимость дополнительного включения в модель каждого фактора. Такая оценка необходима для того, чтобы не загружать модель факторами, не оказывающими существенного влияния на результат. Кроме того, поскольку модель состоит из несколько факторов, то они могут вводиться в нее в различной последовательности, а так как между факторами существует корреляция, значимость включения в модель одного и того же фактора может различаться в зависимости от последовательности введения в нее факторов.
Для оценки значимости включения дополнительного фактора в модель рассчитывается частный критерий Фишера Fxi. Он построен на сравнении прироста факторной дисперсии, обусловленного включением в модель дополнительного фактора, с остаточной дисперсией на одну степень свободы по регрессии в целом. Следовательно, формула расчета частного F-критерия для фактора будет иметь следующий вид:
где R2yx1x2…xi…xp - коэффициент множественной детерминации для модели с полным набором п факторов; R2yx1x2…x i-1 x i+1…xp - коэффициент множественной детерминации для модели, не включающей фактор xi; п - число наблюдений; т - число параметров при факторах x в уравнении регрессии.
Фактическое значение частного критерия Фишера сравнивается с табличным при уровне значимости 0,05 или 0,1 и соответствующих числах степеней свободы. Если фактическое значение Fxi превышает Fтабл , то дополнительное включение фактора xi в модель статистически оправдано, и коэффициент «чистой» регрессии bi при факторе xi статистически значим. Если же Fxi меньше Fтабл , то дополнительное включение в модель фактора существенно не увеличивает долю объясненной вариации результата у, и, следовательно, его включение в модель не имеет смысла, коэффициент регрессии при данном факторе в этом случае статистически незначим.
С помощью частного критерия Фишера можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор xi вводится в уравнение множественной регрессии последним, а все остальные факторы были уже включены в модель раньше.
Оценка значимости коэффициентов «чистой» регрессии bi по критерию Стьюдента t может быть проведена и без расчета частных F-критериев. В этом случае, как и при парной регрессии, для каждого фактора применяется формула
tbi = bi / mbi ,
где bi - коэффициент «чистой» регрессии при факторе xi ; mbi - стандартная ошибка коэффициента регрессии bi .
Для множественной линейной регрессии стандартная ошибка коэффициента регрессии рассчитывается по следующей формуле:
где σy , σxi - среднее квадратическое отклонение соответственно для результата у и xi ; R2yx1x2…xi…xp - коэффициент множественной детерминации для множественной регрессии с набором из р факторов; R2xi x1x2…x i-1 x i+1…xp - коэффициент детерминации для зависимости фактора xi с остальными факторами множественной регрессии.
Полученные значения t-критериев сравниваются с табличными, и на основе этого сравнения принимается или отвергается гипотеза о значимости каждого коэффициента регрессии в отдельности.
Дата добавления: 2015-10-05; просмотров: 6615;