Корреляционный анализ
После выбора вида уравнения регрессии и нахождения его параметров выполняют второй этап КРА – корреляционный анализ, в рамках которого дают оценку тесноты и значимости связи.
В понятие «теснота связи» вкладывается оценка влияния факторного признака на результативный и установление адекватности теоретической зависимости между признаками по фактическим данным. Тесноту связи между признаками оценивают по средствам таких характеристик: коэффициент детерминации; коэффициент корреляции (корреляционное отношение) и др.
Коэффициент детерминации показывает, какая доля общей вариации результата, принятой за 1, формируется под влиянием данного фактора, а какая - за счет воздействия прочих причин. Он используется как при линейной, так и при нелинейной связи между признаками, и в случае парной регрессии рассчитывается по формуле: (9.6)
Коэффициент детерминации принимает значения от 0 до 1. Понятно, что чем ближе коэффициент к 1, тем теснее выявленная зависимость и тем большую роль играет данный фактор в формировании изменений результата. При R2=0 отсутствует линейная связь между признаками.
Коэффициент корреляции (корреляционное отношение) показывает, насколько значимым является влияние признака х на Y. Коэффициент корреляции рассчитывается по формуле: .
Он находится в диапазоне ; чем более близок R к единице, тем теснее корреляционная связь между признаками.
В случае линейной связи между Y и х величина линейного коэффициента корреляции определяется по формулам:
; (9.7)
. (9.8)
Можно использовать и другие формулы, но результат должен быть одинаковым для всех вариантов расчета.
Коэффициент корреляции принимает значения в интервале от -1 до + 1. Принято считать, что если |r|< 0,30, то связь слабая; при |r|= (0,3÷0,7) – средняя; при |r|> 0,70 – сильная, или тесная. Когда |r|= 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи между Y и х.
Когда r>0 , то связь между признаками прямая, при r<0 – обратная.
После установления тесноты связи дают оценку значимости связи между признаками. Под термином «значимость связи» понимают оценку отклонения выборочных переменных от своих значений в генеральной совокупности посредством статистических критериев. Оценку значимости связи осуществляют с использованием F-критерия Фишера и t-критерия Стьюдента.
Для парной регрессии (линейной и нелинейной) F-критерий Фишера рассчитывается по формуле:
, (9.9)
где - число степеней свободы числителя и знаменателя зависимости.
Теоретическое значение F сравнивают с табличным (критическим) значением Fтабл.. Если F> Fтабл, то выборочная совокупность и связь между признаками является значимой.
Для парной линейной регрессии при r=R расчетные критерии t-критерия Стьюдента вычисляются по формуле:
, где (n-2) – число степеней свободы. (9.10)
Критерий Стьюдента, рассчитанный по данной формуле, дает оценку значимости коэффициента корреляции R и существенности связи между признаками. Рассчитанное теоретическое значение t-критерия Стьюдента сравнивают с табличным tтабл, если t>tтабл , то линейный коэффициент корреляции является значимым при характеристики генеральной совокупности.
Дата добавления: 2015-02-25; просмотров: 873;