Основные положения регрессионного анализа

 

В силу воздействия неучтенных случайных факторов и причин отдельные наблюдения переменной будут в большей или меньшей мере отклоняется от функции регрессии . В этом случае уравнение взаимосвязи двух переменных (парная регрессионная модель) может быть представлено в виде

,

где случайная величина (случайный член), характеризующая отклонение от функции регрессии. Эту переменную будем называть возмущением, либо ошибкой. Таким образом, в регрессионной модели зависимая переменная есть некоторая функция с точностью до случайного возмущения

Рассмотрим линейный регрессионный анализ, для которого функция линейная относительно оцениваемых параметров .

Предположим, что для оценки параметров линейной регрессии взята выборка, содержащая пар значений переменных , где . Результаты наблюдений и можно рассматривать как значения случайных величин и имеющих такое распределение как случайные величины и соответственно. В этом случае линейная парная регрессионная модель имеет вид

, . (К14)

Отметим основные предпосылки регрессионного анализа.

(РА1). В модели (К14) возмущение , (или зависимая переменная ) есть величина случайная, а объясняющая переменная – величина не случайная.

(РА2). Математическое ожидание возмущения , равно нулю

(К15)

или математическое ожидание зависимой переменной равно линейной функции регрессии

.

(РА3) (условие гомоскедастичности или равноизменчивости возмущения (зависимой переменной)). Дисперсия возмущения (или зависимой переменной ) постоянна для любого , то есть

(К16)

или

.

(РА4) (условие некоррелированности). Для любых возмущения и удовлетворяют условию

. (К17)

(РА5). Возмущение (или зависимая переменная ) являются нормально распределенными случайными величинами.

В этом случае модель (К14) называется классической нормальной линейной регрессионной моделью (Classical Normal Linear Regression model).

Для получения уравнения регрессии достаточно предпосылок (1) – (4). Требование выполнения предпосылки (5) необходимо для оценки точности уравнения регрессии и его параметров.

Оценкой модели (К14) по выборке является уравнение регрессии (К4). Параметры этого уравнения и определяются на основе метода наименьших квадратов и вычисляются по формулам (К9).

 

Теорема(Гаусса – Маркова). Если регрессионная модель (К14) удовлетворяет предпосылкам (1) – (4), то оценки и , определенные по формулам (К9), имеют наименьшую дисперсию в классе всех линейных несмещенных оценок.

 

Таким образом, оценки и в определенном смысле являются наиболее эффективными линейными оценками параметров и .

 

Воздействие неучтенных случайных факторов и ошибок наблюдений в модели (К14) определяется с помощью дисперсии возмущений (ошибок) или остаточной дисперсии . Несмещенной оценкой этой дисперсии является выборочная остаточная дисперсия

, (К18)

где

групповая средняя, найденная по уравнению регрессии (К4),

выборочная оценка возмущения или остаток регрессии.

Напомним, что в математической статистике для получения несмещенной оценки дисперсии случайной величины соответствующую сумму квадратов отклонений от средней делят не на число наблюдений , а на число степеней свободы , равное разности между числом независимых наблюдений случайной величины и числом связей, ограничивающих свободу их изменения, то есть число уравнений, связывающих эти наблюдения. Поэтому в знаменателе выражения (К18) стоит число степеней свободы , так как две степени свободы теряются при определении двух параметров прямой из системы уравнений (К5).

 

 








Дата добавления: 2018-09-24; просмотров: 773;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.009 сек.