Коэффициент детерминации в парной регрессионной модели
Для того чтобы дать определение статистике ,R-2., представим выборочное значение дисперсии зависимой переменной в следующем виде:
,1-n-1.,--,(,Y-t.-,Y.)-2.=.,1-n-1.,--,,,,Y-t.-,,Y.-t..+(,,Y.-t.-,Y.).-2.=,1-n-1.,--,(,Y-t.-,,Y.-t.)-2.+,1-n-1.,--,(,,Y-t..-,Y.)-2....
или для вариации
,--,,,Y-t.-,Y..-2..=,--,(,Y-t.-,,Y.-t.)-2.+,--,(,,Y-t..-,Y.)-2... (1)
В выражении (1) предполагается, что
,--,,Y-t.-,,Y.-t..,,,Y.-t.-,Y..=0. (2)
Равенство (2) справедливо только в том случае, когда единичный вектор ,I-n,1. включен в число регрессоров. Действительно, поскольку
,e-t.=,Y-t.-,,Y.-t., ,,Y.-t.=,α.+,β.,X-t., ,x-t.=,X-t.-,X,.
,--,,Y-t.-,,Y.-t..,,,Y.-t.-,Y..=,--,e-t.(..,α.+,β.,X-t.-,Y.)=,--,e-t.,,α.+,β.,X-t..-,Y.,--,e-t...=,α.,--,e-t..+,β.,--,e-t.,X-t..+,Y.,--,e-t..=0
только в том случае, если единичный вектор включен в матрицу регрессоров, и необходимыми условиями экстремума являются:
,I-T.e=,--,e-t..=0 и ,X-T.e=,--,X-t.,e-t.=0.,
поэтому (2) справедливо. Часто уравнение (1) записывают в следующих обозначениях:
где
– необъясненная регрессией (остаточная) сумма квадратов отклонений (error sum of squares);
= ‑ объясненная регрессией сумма квадратов отклонений (regression sum of squares);
= ‑ общая сумма квадратов отклонений зависимой переменной от ее среднего выборочного значения (total sum of squares).
Качество подгонки регрессионной модели к наблюденным значениям
, оценивается при помощи статистики —коэффициента детерминации.
Коэффициентом детерминации называется статистика, определяемая по формуле (справедливо только в случае выполнения (2)):
,R-2.=1-,ESS-TSS.=1-,,e-T.e-,y-T.y.=,RSS-TSS.=,,,y.-T.,y.-,y-T.y., 0≤,R-2.≤1 (3)
Из формулы (3) следуют два масштабирующих значения для коэффициента детерминации:
•,R-2.=0, при RSS=,--,(,,Y.-t.-,Y.)-2.=0. в этом случае регрессор X не улучшает качество оценки (прогноза) , по сравнению с тривиальной оценкой (прогнозом) ;
• ,R-2.=1, при ,R-2.=1, в этом случае все точки наблюдения лежат на регрессионной прямой (т. е. , или ,e-t.=0).
Таким образом, чем ближе значение коэффициента детерминации к 1, тем лучше качество подгонки (аппроксимация облака наблюдений линейной функцией) и оценка более точно аппроксимирует наблюдения .
Если свободного члена нет, то коэффициент детерминации не обязан принимать значения от нуля до единицы, т.е. -∞<,R-2.<+∞
Дата добавления: 2015-01-10; просмотров: 2060;