Проверка качества уравнения регрессии. F-критерий Фишера

Как и в случае парной регрессии для оценки качества полученного множественной уравнения регрессии (15.1) можно использовать коэффициент детерминации, представляющий собой отношение объясненной части дисперсии переменной у ко всей дисперсии D(y)

или . (15.19)

где

, .

Коэффициент детерминации принимает значения в диапазоне от нуля до единицы 0 ≤ ≤ 1 и показывает, какая часть дисперсии результативного признака y объяснена уравнением регрессии. Чем выше значение , тем лучше данная модель согласуется с данными наблюдений.

Оценка статистической значимости уравнения регрессии (а также коэффициента детерминации ) осуществляется с помощью F-критерия Фишера

, (15.20)

где p - число независимых переменных в уравнении регрессии (15.1).

Согласно F-критерию Фишера, выдвигаемая «нулевая» гипотеза о статистической незначимости уравнения регрессии отвергается при выполнении условия , где определяется по таблицам F-критерия Фишера по двум степеням свободы , и заданному уровню значимости α.

Для оценки тесноты связи факторов с исследуемым признаком, задаваемой построенным уравнением регрессии , используется коэффициент множественной корреляции R

 

. (15.21)

Коэффициент множественной корреляции R принимает значения в диапазоне 0 ≤ R ≤ 1.

Чем ближе величина R к единице, тем теснее данная связь, тем лучше зависимость согласуется с данными наблюдений. При R=1 ( = 1) связь становится функциональной, т. е. соотношение точно выполняется для всех наблюдений.

Коэффициент множественной корреляции может использоваться как характеристика качества построенного уравнения регрессии , точности построенной модели.

Величина коэффициента множественной корреляции не может быть меньше максимального парного индекса корреляции .

В случае линейной зависимости (3.6) коэффициент корреляции R связан с парными коэффициентами корреляции соотношением

 

, (15.22)

где – стандартизованные коэффициенты регрессии (15.1).

Использование коэффициента множественной детерминации для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину .

Поэтому при большом количестве факторов предпочтительнее использовать, так называемый, скорректированный, улучшенный (adjusted) коэффициент множественной детерминации , определяемый соотношением

, (15.23)

где p – число факторов в уравнении регрессии, n – число наблюдений

Чем больше величина p, тем сильнее различия и .

При использовании для оценки целесообразности включения фактора в уравнение регрессии следует однако учитывать, что увеличение при включении нового фактора не обязательно свидетельствует о его значимости, так как значение увеличивается всегда, когда t-статистика больше единицы ( ).

При заданном объеме наблюдений и при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. При небольшом числе наблюдений скорректированная величина коэффициента множественной детерминации имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.

Отметим, что низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации может быть обусловлено следующими причинами:

– в регрессионную модель не включены существенные факторы;

– неверно выбрана форма аналитической зависимости, не отражающая реальные соотношения между переменными, включенными в модель.








Дата добавления: 2015-11-06; просмотров: 1015;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.006 сек.