Мультиколлинеарность, ее последствия. Установление мультиколлинеарности, методы ее устранения.
Мультиколлинеарность означает, что в множественной регрессионной модели две или большее число независимых переменных (факторов) связаны между собой тесной линейной зависимостью или, другими словами, имеют высокую степень корреляции ( ).
Последствия мультиколлинеарности:
1. Первым практическим последствием мультиколлинеарности является большая дисперсия и ковариация оценок параметров, вычисленных методом наименьших квадратов.
2. Вторым практическим последствием мультиколлинеарности является увеличение доверительных интервалов теоретических коэффициентов уравнения линейной регрессии.
3. Уменьшается статистика коэффициентов, поэтому возможен вывод о статистической незначимости коэффициента.
4. Коэффициенты уравнения регрессии становятся очень чувствительными к малейшим изменениям данных.
5. Затрудняется определение вклада каждой из переменных в объясняемую уравнением дисперсию признака.
К сожалению, нет единого подхода для определения мультиколлинеарности. Приведем несколько методов тестирования наличия мультиколлинеарности.
1) Высокое значение коэффициента детерминации и низкие статистики некоторых переменных.
2) Высокие значения частных коэффициентов корреляции. Однако это условие является достаточным, но не является необходимым условием наличия мультиколлинеарности. Она может иметь место даже при относительно небольших значениях коэффициентов корреляции, когда число факторов больше двух.
3) тест Фаррара–Глобера.
Этот тест имеет и другое название: построение вспомогательной регрессии.
Коэффициент детерминации является коэффициентом детерминации в уравнении регрессии, которое связывает фактор с остальными факторами Например, .является коэффициентом детерминации такой регрессии:
Для каждого коэффициента детерминации рассчитываем отношение:
тест проверяет гипотезу
при конкурирующей гипотезе
Вычисленное значение сравниваем с критическим значением , найденным по таблицам распределения Фишера с и степеням свободы и заданным уровнем значимости. Если то отвергаем нулевую гипотезу и считаем, что фактор является мультиколлинеарным ; если то нулевую гипотезу принимаем и убеждаемся, что фактор не является мультиколлинеарным.
Для устранения мультиколлинеарности существует несколько способов.
Первый способ. Если между двумя факторами и существует мультиколлинеарность, то один из факторов исключается из рассмотрения.
Второй способ заключается в замене фактора после чего проверяют наличие мультиколлинеарности между факторами и При наличии мультиколлинеарности используют первый способ. При отсутствии мультиколлинеарности вместо фактора рассматривают фактор
Иногда для улучшения мультиколлинеарности достаточно увеличить объем выборки. Но при этом может усилиться автокорреляция. Иногда проблема мультиколлинеарности может быть решена путем изменения спецификации модели.
Дата добавления: 2016-05-11; просмотров: 3022;