Понятие линейной однофакторной регрессии

Одна из наиболее простых эконометрических моделей – простая (парная) линейная регрессия. Парная регрессия используется в том случае, когда из всего круга факторов, влияющих на результат, можно выделить один, оказывающий сильное влияние. Он и используется в качестве объясняющей переменной. Представим, что у нас есть два ряда данных:

;

;

где – число наблюдений. Каждое из наблюдений характеризуется двумя переменными и .

Линейная однофакторная регрессия – уравнение связи результативного показателя и фактора в виде линейного уравнения:

или

где – зависимая (объясняемая) переменная, реальная или фактическая или, как её ещё называют, эмпирическая, то есть, наблюдавшаяся в действительности;

x – независимая (объясняющая) переменная;

– зависимая переменная (результат), рассчитанная с помощью уравнения регрессии, ещё её называют теоретической (в данном случае она рассчитывается по линейному уравнению регрессии);

и – константы, параметры уравнения линейной регрессии;

– случайная компонента, или возмущение.

Случайная компонента по своей сути есть случайная величина, характеризующая влияние не учтенных в модели факторов, каких-либо случайных влияний, неправильный выбор специфики модели и, в некоторых случаях, может быть связана с особенностями измерения.

Каждую пару наблюдений ( ) можно отобразить в качестве точки на плоскости . Такое графическое построение называется полем корреляции.

Рис. 1. – Линия регрессии

В каждом из наблюдений величину случайной компоненты можно определить как разность между фактическим значением результата и рассчитанным по уравнению регрессии:

.

Если на графике все точки ( ) совпадают с линией регрессии, тогда между результативным признаком и фактором существует строгая функциональная связь и выполняется следующее равенство:

для каждого .

В экономических процессах такое практически не встречается, но во всех случаях, когда применение МНК оправдано, верно, что , поэтому в качестве меры отклонений используется сумма квадратов отклонений , в частности используется остаточная дисперсия.

2. Определение параметров линейной регрессии

методом наименьших квадратов (МНК)

Для нахождения параметров и уравнения линейной регрессии обычно используется метод наименьших квадратов – метод определения зависимости результирующего показателя от факторов путем минимизации суммы квадратов отклонений фактических значений результирующего показателя от значений, определяемых уравнением регрессии.

Сущность метода наименьших квадратов заключается в нахождении параметров модели и , при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:

. (1)

Для линейной однофакторной модели:

. (2)

Функция двух переменных может достигнуть экстремума в том случае, когда первые частные производные этой функции равняются нулю, т.е. когда

и (3)

Вычисляя эти частные производные, получим:

(4)

После несложных преобразований получаем систему нормальных уравнений для определения величины параметров и , уравнения линейной однофакторной модели:

(5)

где – объем исследуемой совокупности (число единиц наблюдений).

В уравнении регрессии свободный член регрессии коэффициент показывает совокупное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; его вклад в значение результирующего показателя не зависит от изменения факторов.

Параметр коэффициент регрессии – показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения. При наличии прямой связи имеет положительное значение, и при увеличении фактора результат увеличивается и линия регрессии возрастающая. В случае обратной связи коэффициент регрессии отрицательный, и при возрастании фактора результат уменьшается, в этом случае линия регрессии имеет отрицательный наклон.

Для определения величин и необходимо вычислить следующие значения: , , , . Расчеты рекомендуется проводить в таблице:

Таблица 1 – расчет параметров уравнения регрессии

N п/п
         
….          
         
Итого

 

(6)

(7)

Параметр оценивается по следующей формуле:

. (8)

Правильность расчета параметров уравнения регрессии может быть проверена с помощью сравнения сумм . На практике из-за округления при расчетах возможно некоторое расхождение.

Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость, выражаемая формулой:

(9)

Коэффициент регрессии применяют для определения коэффициента эластичности, который показывает, на сколько процентов изменится величина результативного признака при изменении факторного на один процент.

Для определения коэффициента эластичности используется формула:

(10)

где , – средние значения признаков, вычисляемых:

, (11)

 

3. Оценка существенности уравнения линейной регрессии

После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.

Оценка значимости уравнения регрессии в целом осуществляется с помощью критерия Фишера, так называемого -критерия. При этом выдвигается нулевая гипотеза , что коэффициент регрессии равен нулю, то есть , а значит фактор не оказывает влияния на результат и линия регрессии параллельна оси абсцисс.

Для определения -критерия необходимо рассчитать дисперсии на одну степень свободы .

Общую сумму квадратов отклонений от можно разложить на суммы – объясненную регрессией и необъясненную:

,

где – общая сумма квадратов отклонений индивидуальных значений результата от среднего по выборке;

– сумма квадратов отклонений, объясненная регрессией;

– сумма квадратов отклонений, необъясненная регрессией, ещё её называют остаточной суммой квадратов отклонений.

Любая сумма квадратов отклонений связана с числом степеней свободы , то есть с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности и с числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показать, сколько независимых отклонений из возможных требуется для образования данной суммы квадратов. Для общей суммы квадратов требуется ( ) независимых отклонений, ибо по совокупности из единиц после расчета среднего уровня свободно варьируют лишь ( ) число отклонений.

При расчете объясненной или факторной суммы квадратов используются теоретические значения результативного признака , найденные по линии регрессии: .

В линейной регрессии .

Поскольку при определенном объеме наблюдений по и факторная сумма квадратов при линейной регрессии зависит только от одной постоянной – коэффициента регрессии , то данная сумма квадратов имеет одну степень свободы. К этому же выводу можно прийти, если рассмотреть составляющие расчетного значения признака .

Существует равенство между числом степеней свободы общей, факторной и остаточной суммами квадратов. Число степеней свободы остаточной суммы квадратов при линейной регрессии составляет ( ). Число степеней свободы для общей суммы квадратов определяется числом единиц, и поскольку мы используем среднюю вычисленную по данным выборки, то теряем одну степень свободы, то есть . Теперь мы имеем два равенства:

,

.

Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, дисперсии на одну степень свободы.

,

,

.

Так как это дисперсии на одну степень свободы, их можно сравнивать между собой. Критерии Фишера позволяет проверить нулевую гипотезу о том, что факторная и остаточная дисперсии на одну степень свободы равны между собой . Критерий Фишера рассчитывается по следующей формуле:

.

Если гипотеза подтверждается, то факторная и остаточная дисперсии одинаковы и уравнение регрессии незначимо. Чтобы отвергнуть нулевую гипотезу и подтвердить значимость уравнения регрессии в целом, необходимо, чтобы факторная дисперсия на одну степень свободы превышала остаточную дисперсию на одну степень свободы в несколько раз. Существуют специальные таблицы критических значений Фишера при разных уровнях надежности и различных степенях свободы. Эти таблицы содержат максимальные значения отношения дисперсий, при которых нулевая гипотеза подтверждается. Значение критерия Фишера сравнивается с табличным и на основе этого гипотеза принимается или отвергается.

Если , тогда гипотеза отклоняется и делается вывод, что связь между и существенна и уравнение регрессии статистически значимо.

Если же , тогда гипотеза принимается и делается вывод, что уравнение регрессии статистически незначимо, так как существует риск (при заданном уровне надежности) сделать неправильный вывод о наличии связи между и .

Между -критерием и коэффициентом детерминации существует связь, которую можно выразить через следующую формулу:

Небольшие расхождения результатов при практических расчетах могут быть связаны с округлением.

 








Дата добавления: 2016-05-25; просмотров: 61367;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2026 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.019 сек.