Коэффициент детерминации в парной регрессионной модели

Для того чтобы дать определение статистике ,R-2., представим выборочное значение дисперсии зависимой переменной в следующем виде:

,1-n-1.,--,(,Y-t.-,Y.)-2.=.,1-n-1.,--,,,,Y-t.-,,Y.-t..+(,,Y.-t.-,Y.).-2.=,1-n-1.,--,(,Y-t.-,,Y.-t.)-2.+,1-n-1.,--,(,,Y-t..-,Y.)-2....

или для вариации

,--,,,Y-t.-,Y..-2..=,--,(,Y-t.-,,Y.-t.)-2.+,--,(,,Y-t..-,Y.)-2... (1)

В выражении (1) предполагается, что

,--,,Y-t.-,,Y.-t..,,,Y.-t.-,Y..=0. (2)

Равенство (2) справедливо только в том случае, когда единичный вектор ,I-n,1. включен в число регрессоров. Действительно, поскольку

,e-t.=,Y-t.-,,Y.-t., ,,Y.-t.=,α.+,β.,X-t., ,x-t.=,X-t.-,X,.

,--,,Y-t.-,,Y.-t..,,,Y.-t.-,Y..=,--,e-t.(..,α.+,β.,X-t.-,Y.)=,--,e-t.,,α.+,β.,X-t..-,Y.,--,e-t...=,α.,--,e-t..+,β.,--,e-t.,X-t..+,Y.,--,e-t..=0

только в том случае, если единичный вектор включен в матрицу регрессоров, и необходимыми условиями экстремума являются:

,I-T.e=,--,e-t..=0 и ,X-T.e=,--,X-t.,e-t.=0.,

поэтому (2) справедливо. Часто уравнение (1) записывают в следующих обозначениях:


где

– необъясненная регрессией (остаточная) сумма квадратов отклонений (error sum of squares);

= ‑ объясненная регрессией сумма квадратов отклонений (regression sum of squares);

= ‑ общая сумма квадратов отклонений зависимой переменной от ее среднего выборочного значения (total sum of squares).

Качество подгонки регрессионной модели к наблюденным значениям

, оценивается при помощи статистики —коэффициента детерминации.

Коэффициентом детерминации называется статистика, определяемая по формуле (справедливо только в случае выполнения (2)):

,R-2.=1-,ESS-TSS.=1-,,e-T.e-,y-T.y.=,RSS-TSS.=,,,y.-T.,y.-,y-T.y., 0≤,R-2.≤1 (3)

Из формулы (3) следуют два масштабирующих значения для коэффициента детерминации:

,R-2.=0, при RSS=,--,(,,Y.-t.-,Y.)-2.=0. в этом случае регрессор X не улучшает качество оценки (прогноза) , по сравнению с тривиальной оценкой (прогнозом) ;

,R-2.=1, при ,R-2.=1, в этом случае все точки наблюдения лежат на регрессионной прямой (т. е. , или ,e-t.=0).

Таким образом, чем ближе значение коэффициента детерминации к 1, тем лучше качество подгонки (аппроксимация облака наблюдений линейной функцией) и оценка более точно аппроксимирует наблюдения .

Если свободного члена нет, то коэффициент детерминации не обязан принимать значения от нуля до единицы, т.е. -∞<,R-2.<+∞








Дата добавления: 2015-01-10; просмотров: 1960;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.004 сек.