Исследование уравнений регрессии.

Для наблюденных пар {X_i, Y_i} было построено уравнение регрессии . В каждой точке X_i получено отклонение «предсказанного» значения от наблюденного Y_i: Это отклонение (остаток) можно представить в виде:

(1)

Уравнение (1) можно представить в виде.

(2)

Возведя в квадрат обе части уравнения (2) и просуммировав все уравнения по i: i=1, ... , n, получим [2]

(3)

В уравнении (3) сумма является суммой квадратов отклонений зависимой переменной относительно среднего значения .

Сумма - представляет собой сумму квадратов отклонений предсказанных значений относительно среднего значения независимой переменной (сумма квадратов, обусловленная регрессией) и характеризует угол наклона линии регрессии.

Сумма - сумма квадратов отклонений i - го наблюдения величины Y - oт ее предсказанного значения . Таким образом, уравнение (3) можно выразить следующим образом:

Качество построенной модели тем выше, чем больше сумма квадратов, обусловленная регрессией, превосходит сумму квадратов остатков относительно регрессии!

Так как сумма квадратов отклонений пропорциональна дисперсии случайной величины, то уравнение (3) называется основным уравнениемдисперсионного анализа.

В статистике исследуются средние квадраты остатков, которые получаются делением их суммы на число степеней свободы.

Под числом степеней свободы некоторой статистики понимается разность между числом наблюдений и числом параметров, определенных по этим наблюдениям [3].

Сумма квадратов отклонений относительно среднего имеет (n-1) степеней свободы [3]. С учетом выше изложенного строится таблица дисперсионного анализа.

Источник вариации.	Число степеней свободы.	Суммы квадратов (SS).	Средний квадрат (MS).
Обусловленный регрессией.			MS рег.=
Остаток относительно регрессии.	n -2		S=
Общий	n - 1

Если наблюдения независимые, а их погрешности подчиняются нормальному распределению, то отношение подчиняется F - распределению с числом степеней свободы g₁ =1, g₂ =n - 2

Задавая уровень значимости a, и сравнивая Fвыч.= с табличным значением F - распределения, можно проверить гипотезу о значимости отличия MS_рег от S (При этом вероятность ошибки будет равна a. В ППП «STATISTICA» уровень вероятностей ошибки -P выводится на экран). 100×(1-a)%-е доверительные интервалы для коэффициентов b₀ и b₁определяются выражением [2]:

b_0: (3)

b₁: (4)

где S - средний остаток относительно регрессии (остаточная дисперсия). Для проверки гипотезы о равенстве параметра b₀некоторой заданной величине b₀₀ (H₀: b₀=b₀₀) вычисляется величина t

(4)

Вычисленное значение t сравнивается с табличным . Если t вычисл. < t таблич., гипотеза H₀ принимается.

Для проверки гипотезы о равенстве параметра b₁ некоторой величине b₁₀ вычисляется статистика

(5)

и сравнивается с табличным значением

Решение о принятии гипотезы H₀: b₁=b₁₀ принимается при t выч.< t табл.

Оценка стандартного отклонения вычисленного значения (при X=X₀) равна [3]

СКО (6)

Доверительные интервалы для с доверительной вероятностью P=1-a определяются выражением

(7)

<7 8 9 10 11 1213>

Дата добавления: 2016-02-20; просмотров: 844;