Коэффициентов уравнения множественной регрессии
Числовыми характеристиками точности коэффициентов множественной регрессии (параметров модели) , являются их средние квадратические отклонения (стандартные ошибки) , величина которых прямо пропорциональна S.
Можно показать, что матрица ковариаций вектора параметров модели В (матричный аналог дисперсии) может быть представлена в виде:
. (3.21)
Напомним, что ковариация двух переменных характеризует как степень рассеяния относительно их математических ожиданий, так и взаимосвязь этих переменных. При выполнении предпосылок МНК математическое ожидание .
Рассматривая матрицу ковариаций V(B) с элементами σij, можно заметить, что на ее главной диагонали находятся дисперсии оценок параметров модели, т. е. . Тогда для выборочных дисперсий эмпирических коэффициентов справедливо выражение:
(3.22)
где – выборочная дисперсия случайных отклонений (остатков); – диагональный элемент матрицы (ХТХ)-1.
Стандартная ошибка j-го коэффициента регрессии будет определяться по формуле:
(3.23)
Таким образом, с помощью обратной матрицы (ХТХ)-1 определяется не только сам вектор оценок параметров (3.17), но и стандартные ошибки его компонент.
В частности, для модели с двумя объясняющими переменными (факторами) стандартные ошибки вычисляются по следующим формулам:
(3.24)
,
где – выборочный коэффициент корреляции между объясняющими переменными Х1 и Х2.
Из формул (3.24) следует, что стандартные ошибки тем меньше, чем меньше степень взаимного влияния факторов-аргументов, определяемая значением .
Рассчитав стандартные ошибки коэффициентов множественной линейной регрессии, можно приступать к проверке статистической значимости этих коэффициентов (параметров модели). Как и в случае парной регрессии, эта задача решается по схеме статистической проверки гипотез. Используется статистика которая имеет в данной ситуации распределение Стьюдента с числом степеней свободы v = n - m - 1 (n – объем выборки, m – число объясняющих переменных в модели). При требуемом уровне значимости a наблюдаемое значение t-статистики сравнивается с критической точкой ta, n - m - 1 распределения Стьюдента.
Если установлено, что |tнабл| > tкр, то коэффициент считается статистически значимым. В случае, когда |tнабл| £ tкр коэффициент считается статистически незначимым (статистически близким к нулю). Это означает, что фактор-аргумент Хj не обладает существенной линейной связью с исследуемой переменной Y. Другими словами, этот фактор не оказывает заметного влияния на результирующий экономический показатель и лишь искажает реальную картину взаимосвязи.
Формально, после установления факта статистической незначимости коэффициента , следует исключить из уравнения регрессии переменную Хj, что упрощает модель и делает ее более конкретной. Однако в эконометрических исследованиях вопрос об исключении из уравнения модели незначимых переменных не должен решаться столь однозначно. Окончательное решение должно быть принято после тщательного качественного анализа.
Надежность полученных оценок также определяется доверительными интервалами для параметров модели. Если учесть, что относительная величина имеет распределение Стьюдента и выполнятся условие (ta, n - m - 1 определяется по таблице критических точек распределения Стьюдента), то доверительный интервал, накрывающий с надежностью (1 - a) неизвестное значение теоретического параметра bj, определяется неравенством:
. (3.25)
Аналогично парной регрессии (см. раздел 2.5) может быть построена интервальная оценка для индивидуальных значений зависимой переменной у0 при заданном векторе аргументов Х0:
(3.26)
где – средняя квадратическая ошибка рассчитанных по модели (прогнозируемых) значений , записанная в матричной форме.
Дата добавления: 2016-06-02; просмотров: 1432;