Основные положения регрессионного анализа

В силу воздействия неучтенных случайных факторов и причин отдельные наблюдения переменной будут в большей или меньшей мере отклоняется от функции регрессии . В этом случае уравнение взаимосвязи двух переменных (парная регрессионная модель) может быть представлено в виде

где – случайная величина (случайный член), характеризующая отклонение от функции регрессии. Эту переменную будем называть возмущением, либо ошибкой. Таким образом, в регрессионной модели зависимая переменная есть некоторая функция с точностью до случайного возмущения

Рассмотрим линейный регрессионный анализ, для которого функция линейная относительно оцениваемых параметров .

Предположим, что для оценки параметров линейной регрессии взята выборка, содержащая пар значений переменных , где . Результаты наблюдений и можно рассматривать как значения случайных величин и имеющих такое распределение как случайные величины и соответственно. В этом случае линейная парная регрессионная модель имеет вид

, . (К14)

Отметим основные предпосылки регрессионного анализа.

(РА1). В модели (К14) возмущение , (или зависимая переменная ) есть величина случайная, а объясняющая переменная – величина не случайная.

(РА2). Математическое ожидание возмущения , равно нулю

(К15)

или математическое ожидание зависимой переменной равно линейной функции регрессии

(РА3) (условие гомоскедастичности или равноизменчивости возмущения (зависимой переменной)). Дисперсия возмущения (или зависимой переменной ) постоянна для любого , то есть

(К16)

или

(РА4) (условие некоррелированности). Для любых возмущения и удовлетворяют условию

. (К17)

(РА5). Возмущение (или зависимая переменная ) являются нормально распределенными случайными величинами.

В этом случае модель (К14) называется классической нормальной линейной регрессионной моделью (Classical Normal Linear Regression model).

Для получения уравнения регрессии достаточно предпосылок (1) – (4). Требование выполнения предпосылки (5) необходимо для оценки точности уравнения регрессии и его параметров.

Оценкой модели (К14) по выборке является уравнение регрессии (К4). Параметры этого уравнения и определяются на основе метода наименьших квадратов и вычисляются по формулам (К9).

Теорема(Гаусса – Маркова). Если регрессионная модель (К14) удовлетворяет предпосылкам (1) – (4), то оценки и , определенные по формулам (К9), имеют наименьшую дисперсию в классе всех линейных несмещенных оценок.

Таким образом, оценки и в определенном смысле являются наиболее эффективными линейными оценками параметров и .

Воздействие неучтенных случайных факторов и ошибок наблюдений в модели (К14) определяется с помощью дисперсии возмущений (ошибок) или остаточной дисперсии . Несмещенной оценкой этой дисперсии является выборочная остаточная дисперсия

, (К18)

где

– групповая средняя, найденная по уравнению регрессии (К4),

– выборочная оценка возмущения или остаток регрессии.

Напомним, что в математической статистике для получения несмещенной оценки дисперсии случайной величины соответствующую сумму квадратов отклонений от средней делят не на число наблюдений , а на число степеней свободы , равное разности между числом независимых наблюдений случайной величины и числом связей, ограничивающих свободу их изменения, то есть число уравнений, связывающих эти наблюдения. Поэтому в знаменателе выражения (К18) стоит число степеней свободы , так как две степени свободы теряются при определении двух параметров прямой из системы уравнений (К5).

<1 234 5 6 7 >

Дата добавления: 2018-09-24; просмотров: 879;