Коэффициенты множественной корреляции и детерминации
Общее качество уравнения множественной регрессии оценивается с помощью коэффициента множественной корреляции и его квадрата – коэффициента множественной детерминации.
По аналогии с парной регрессией коэффициент множественной детерминацииможно определить как долю дисперсии результата, объясненную вариацией включенных в модель факторов, в его общей дисперсии:
Значения коэффициента множественной детерминации изменяются от нуля до единицы (0≤R2yx1x2…xp≤1). Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение результата.
Коэффициент множественной корреляциихарактеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком или, иными словами, оценивает тесноту связи совместного влияния факторов на результат.
Коэффициент множественной корреляции может быть найден как корень квадратный из коэффициента множественной детерминации:
Значения коэффициентов множественной корреляции изменяются от нуля до единицы (0≤Ryx1x2…xp≤1). Чем ближе коэффициент единице, тем теснее связь между результатом и всеми факторами в совокупности и уравнение регрессии лучше описывает фактические данные. Если множественный коэффициент корреляции Ryx1x2…xp близок к нулю, то уравнение регрессии плохо описывает фактические данные, и факторы оказывают слабое влияние на результат.
Значение коэффициента множественной корреляции больше или равно величине максимального коэффициента парной корреляции:
Ry x1x2…xp ≥ І ry xi (max) І , где i = 1,р.
Если в уравнении регрессии учитывается какой-либо фактор, оказывающий наиболее сильное воздействие на результативный признак, то частный коэффициент корреляции будет достаточно близок к коэффициенту множественной корреляции, но ни в коем случае не больше него.
Иногда для расчета коэффициента множественной корреляции используется еще одна формула (она применима только для линейной множественной регрессии):
где DetІR+І, DetІRІ - определители матриц соответственно парных коэффициентов корреляции и межфакторной корреляции.
Эти определители будут иметь следующий вид для уравнения линейной множественной регрессии с р числом факторов:
1 ryx1 ryx2 … ryxp
ryx1 1 rx1x2 … rx1xp
Det ІR+І = ryx2 rx1x2 1 … rx2xp ,
… … … … …
ryxp rx1xp rx2xp … 1
т.е. матрица включает все парные коэффициенты корреляции для уравнения регрессии;
1 rx1x2 … rx1xp
Det ІRІ = rx1x2 1 … rx2xp
… … … … ,
rx1xp rx2xp … 1
т.е. данная матрица получается из предыдущей матрицы путем исключения коэффициентов парной корреляции факторов с результатом (вычеркиваются первая строка и первый столбец).
Для того, чтобы не допустить возможного преувеличения тесноты связи, обычно применяется скорректированный коэффициент множественной корреляции. Он содержит поправку на число степеней свободы. Ocтaточная сумма квадратов отклонений делится на число степеней свободы остаточной вариации (п - т - 1), а общая сумма квадратов отклонений - на число степеней свободы в целом по совокупности (п - 1). Формула скорректированного коэффициента множественной корреляции имеет следующий вид:
где т - число параметров при переменных х (в линейной зависимости оно будет равно числу включаемых в модель факторов = p); п - число наблюдений.
Так как , R2 – коэффициент множественной детерминации, то скорректированный коэффициент множественной корреляции
а скорректированный коэффициент множественной детерминации
Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.
Дата добавления: 2015-10-05; просмотров: 6447;