Проверка качества уравнения регрессии. F-критерий Фишера
Как и в случае парной регрессии для оценки качества полученного множественной уравнения регрессии (15.1) можно использовать коэффициент детерминации, представляющий собой отношение объясненной части
дисперсии переменной у ко всей дисперсии D(y)
или
. (15.19)
где
,
.
Коэффициент детерминации
принимает значения в диапазоне от нуля до единицы 0 ≤
≤ 1 и показывает, какая часть дисперсии результативного признака y объяснена уравнением регрессии. Чем выше значение
, тем лучше данная модель согласуется с данными наблюдений.
Оценка статистической значимости уравнения регрессии (а также коэффициента детерминации
) осуществляется с помощью F-критерия Фишера
, (15.20)
где p - число независимых переменных в уравнении регрессии (15.1).
Согласно F-критерию Фишера, выдвигаемая «нулевая» гипотеза
о статистической незначимости уравнения регрессии отвергается при выполнении условия
, где
определяется по таблицам F-критерия Фишера по двум степеням свободы
,
и заданному уровню значимости α.
Для оценки тесноты связи факторов с исследуемым признаком, задаваемой построенным уравнением регрессии
, используется коэффициент множественной корреляции R
. (15.21)
Коэффициент множественной корреляции R принимает значения в диапазоне 0 ≤ R ≤ 1.
Чем ближе величина R к единице, тем теснее данная связь, тем лучше зависимость
согласуется с данными наблюдений. При R=1 (
= 1) связь становится функциональной, т. е. соотношение
точно выполняется для всех наблюдений.
Коэффициент множественной корреляции может использоваться как характеристика качества построенного уравнения регрессии
, точности построенной модели.
Величина коэффициента множественной корреляции не может быть меньше максимального парного индекса корреляции
.
В случае линейной зависимости (3.6) коэффициент корреляции R связан с парными коэффициентами корреляции
соотношением
, (15.22)
где
– стандартизованные коэффициенты регрессии (15.1).
Использование коэффициента множественной детерминации
для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину
.
Поэтому при большом количестве факторов предпочтительнее использовать, так называемый, скорректированный, улучшенный (adjusted) коэффициент множественной детерминации
, определяемый соотношением
, (15.23)
где p – число факторов в уравнении регрессии, n – число наблюдений
Чем больше величина p, тем сильнее различия
и
.
При использовании
для оценки целесообразности включения фактора в уравнение регрессии следует однако учитывать, что увеличение
при включении нового фактора не обязательно свидетельствует о его значимости, так как значение увеличивается
всегда, когда t-статистика больше единицы (
).
При заданном объеме наблюдений и при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. При небольшом числе наблюдений скорректированная величина коэффициента множественной детерминации
имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.
Отметим, что низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации
может быть обусловлено следующими причинами:
– в регрессионную модель не включены существенные факторы;
– неверно выбрана форма аналитической зависимости, не отражающая реальные соотношения между переменными, включенными в модель.
Дата добавления: 2015-11-06; просмотров: 1085;
