Оценка качества модели множественной регрессии: F-критерий Фишера, t-критерий Стьюдента. Мультиколлинеарность. Методы устранения мультиколлинеарности.
Значимость уравнения множественной регрессий в целом, так же как и в парной регрессии, оценивается с помощью F-критерия Фишера :
(3.32)
Где - факторная сумма квадратов на одну степень свободы;
- остаточная сумма квадратов на одну степень свободы;
- коэффициент (индекс) множественной детерминации;
m - число параметров при переменных х (в линейной регрессии совпадает с числом включенных в модель факторов);
n - число наблюдений .
Оценивается значимость не толь ко уравнения в целом, но и фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший вариации в модель, может существенно увеличивать долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частный F- критерий, т.е. .
(3.33)
Где - коэффициент множественной детерминации для модели с полным набором факторов;
- тот же показатель, но без включения в модель фактора ;
- число наблюдений ;
- число параметров в модели (без свободного члена ).
Если оцениваем значимость влияния фактора , то формула частного F –критерия примет вид:
( 3.34)
В общем виде для фактора частный -критерий определится как
В числителе – прирост доли вариации у за счет дополнительный включается в модель соотношения фактура, в значении доля остаточных вариации для полной модели
Рассмотреть зависимость объема продукции у от затрат труда х, и технической оснащенности производства
и
Дисперсионный анализ
Частный F-критерий оценивает значимость коэффициентов чистой регрессии. Зная величину Fxi, можно определить и t-критерий для коэффициента регрессии при i-м факторе, tbi, а именно:
Если уравнение содержит больше двух факторов, то соответствующая программа РС дает таблицу дисперсионного анализа, показывая значимость последовательного добавления к уравнению регрессии соответствующего фактора. Так, если рассматривается уравнение:
то определяются последовательно F-критерий для уравнения с одним фактором х1, далее F-критерий для дополнительного включения в модель фактора х2, т.е. для перехода от однофакторного уравнения регрессии к двухфакторному, и наконец, F-критерий для дополнительного включения в модель фактора х3, т.е дается оценка значимости фактора х3 после включения в модель факторов х1 и х2. В этом случае F-критерий для дополнительного включения фактора х2 после х1 является последовательным в отличие от F-критерия для дополнительного включения фактора х3, который является частным F-критерием, ибо оценивает значимость фактора в предположении, что он включен в модель последним. С t-критерием Стьюдента связан именно частный F-критерий. Последовательный F-критерий может интересовать исследователя на стадии формирования модели.
Оценка значимости коэффициентов чистой регрессии по t-критерию Стьюдента может быть проведена и без расчета частных F-критериев. В этом случае, как и в парной регрессии, для каждого фактора используется формула:
где bi - коэффициент чистой регрессии при факторе хi
mbi – средняя квадратическая ошибка коэффициента регрессии bi
Для уравнения множественной регрессии:
средняя квадратическая ошибка коэффициента регрессии может быть определена по следующей формуле
- среднее квадратическое отклонение для признака у;
- среднее квадратическое отклонение для признака хi
- коэффициент детерминации для уравнения множественнаой регрессии.
- коэффициент детерминации для значимости фактора хi со всеми другими факторами уравнения множественной регрессии.
n – m – 1 - число степеней свободы для остаточной суммы квадратов отклонений.
Как видим, чтобы воспользоваться данной формулой, необходимы матрица межфакторной корреляции и расчет по ней соответствующих коэффициентов детерминации . Так, для уравнения
оценка значимости коэффициентов регрессии b1, b2, b3 предполагает расчет трех межфакторных коэффициентов детерминации, а именно: , , .
Вместе с тем, если учесть, что
то можно убедиться, что
На основе соотношения bi и mbi получим
Аналогично можно оценивать и существенность частных показателей корреляции. Фактическое значение частного коэффициента корреляции сравнивается с табличным значением при или и числе степеней свободы k=n-h-2, где n - число наблюдений, h - число исключенных переменных. Так, если n =30 и оценивается существенность частного коэффициента корреляции второго порядка (например, ), то h=2 и k=26.
Если h является наивысшим порядком расчета частных коэффициентов корреляции для уравнения регрессии, то практически величина k совпадает с числом степеней свободы для остаточной вариации с n-m-1. Так, в уравнении , рассчитанном при n=30, n-m-1 =26. Если же уравнение регрессии дополняется расчетом частных коэффициентов корреляции разных порядков (второго, третьего и т.п.), то
k=n-h-2
Если величина частного F-критерия выше табличного значения, то это означает одновременного не только значимость рассматриваемого коэффициента регрессии, но и значимость частного коэффициента корреляции. Существует взаимосвязь между квадратом частного коэффициента корреляции и частным F-критерием, а именно:
Где - частный коэффициент детерминации фактора с y при неизменном уровне всех других факторов.
- доля остаточной вариации уравнения регрессии , включающего все факторы, кроме фактора
- доля остаточной вариации для уравнения регрессии с полным набором факторов.
Пример. Для рассматриваемой регрессии
; ;
Тогда
что соответствует ранее определенной величине .
Взаимосвязь показателей частного коэффициента корреляции, частного F-критерия и t- критерия Стьюдента для коэффициентов чистой регрессии может использоваться в процедуре отбора факторов. Отсев факторов при построении уравнения регрессии методом исключения практически можно осуществлять не только по частным коэффициентам корреляции, исключая на каждом шаге фактор с наименьшим незначимым значением частного коэффициента корреляции, но и по величинам tbi и Fxi. Частный F-критерий широко используется и при построении модели методом включения переменных и шаговым регрессионным методом.
Дата добавления: 2016-05-16; просмотров: 1435;