Использование парной корреляции для изучения стохастических взаимосвязей и правила отбора факторов
Для изучения связи факторного и результативного показателей используется парная корреляция.
Для определения влияния фактора на величину результативного показателя с помощью парной корреляции сначала подбирается соответствующий тип математического уравнения, которое наилучшим образом отражает характер изучаемой связи (прямолинейный, криволинейный и т. д.). Это играет важную роль в корреляционном анализе, потому что от правильного выбора уравнения регрессии зависят ход решения задачи и результаты расчетов. Обоснование уравнения связи производится с помощью сопоставления параллельных рядов, группировки данных и линейных графиков.
Наиболее простым уравнением, которое характеризует прямолинейную зависимость между двумя показателями, является уравнение прямой:
ух=а+b∙х,
где ух - результативный показатель;
а,b- параметры уравнения регрессии;
х - факторный показатель.
Это уравнение описывает такую связь между двумя признаками, при которой с изменением факторного показателя на определенную величину наблюдается равномерное возрастание или убывание значений результативного показателя. Коэффициент а - постоянная величина результативного показателя, которая не связана с изменением данного фактора. Параметр b показывает среднее изменение результативного показателя с повышением или понижением величины фактора на единицу его измерения.
Значения коэффициентов а и b находят из системы уравнений, полученных по способу наименьших квадратов. В данном случае система уравнений имеет следующий вид:
где п - количество наблюдений.
Количество наблюдений при прямолинейной зависимости должно составлять не менее двадцати.
Кроме прямолинейной зависимости между изучаемыми показателями может возникать и криволинейная зависимость. Если при увеличении одного показателя значение другого возрастает до определенного уровня, а потом начинает снижаться (например, зависимость производительности труда рабочих от их возраста), то для записи криволинейной зависимости лучше всего подходит парабола второго порядка:
В соответствии с требованиями способа наименьших квадратов для определения параметров а, b и с необходимо решить следующую систему уравнений:
.
Параметры а, b и с находят способом определителей или способом исключения.
Часто в анализе для записи криволинейных зависимостей используется гипербола:
Гипербола описывает такую зависимость между исследуемыми показателями, когда при увеличении одной переменной значения другой увеличиваются до определенного уровня, а потом прирост снижается (например, зависимость себестоимости продукции от объема производства).
Для определения параметров а и b необходимо решить следующую систему уравнений:
При более сложном характере зависимости между изучаемыми явлениями используются более сложные параболы (третьего, четвертого порядка и т. д.), а также квадратические, степенные, показательные и другие функции.
Выбор конкретного уравнения регрессии, адекватно описывающего форму связи, является довольно сложной процедурой. В условиях использования ПЭВМ выбор адекватной модели в анализе парной корреляции осуществляется перебором решений. Если форму связи сразу установить сложно, решают уравнения нескольких типов. Выбор адекватной модели производится на основе ошибки аппроксимации, которая не должна превышать 0,2, или 20 %. При этом наименьшее значение ошибки аппроксимации свидетельствует о том, что оцениваемая модель дает наиболее адекватное описание формы взаимосвязи.
Таким образом, используя определенный тип математического уравнения, можно установить степень зависимости между изучаемыми показателями, т. е. узнать, на сколько единиц в абсолютном измерении изменяется величина результативного показателя с изменением факторного на единицу. Однако регрессионный анализ не позволяет определить, является ли тесной полученная связь и оказывает ли решающее воздействие данный фактор на величину результативного показателя.
Для измерения тесноты связи между факторными и результативным показателями определяется:
- при прямой зависимости - коэффициент корреляции:
- при криволинейной зависимости - корреляционное отношение:
где - общая дисперсия, рассчитываемая по формуле:
- межгрупповая дисперсия, определяемая формулой:
Коэффициент корреляции (корреляционное отношение) принимает значение от 0 до 1 и характеризирует вид связи между результативным и факторным показателями:
если ( ) = 0, то связь отсутствует;
если ( ) = 1, то связь функциональная (детерминированная);
если ( ) - отрицательная величина, то связь между показателями обратная.
Коэффициент корреляции (корреляционное отношение) дает количественную оценку тесноты связи, характеризирует силу влияния факторного показателя на изменение результативного. Теснота связи в зависимости от значения величины коэффициента корреляции (корреляционного отношения) подразделяется следующим образом:
- слабая, если величина коэффициента корреляции (корреляционного отношения) от 0,3 до 0,5;
- умеренная, если величина коэффициента корреляции (корреляционного отношения) от 0,5 до 0,7;
- заметная, если величина коэффициента корреляции (корреляционного отношения) от 0,5 до 0,7;
- высокая, если величина коэффициента корреляции (корреляционного отношения) от 0,7 до 0,9;
- весьма высокая, если величина коэффициента корреляции (корреляционного отношения) от 0,9 до 0,99.
Если коэффициент корреляции возвести в квадрат, то получим коэффициент детерминации, отражающий долю влияния исследуемого фактора на результативный показатель.
При значениях тесноты связи меньше 0,7 величина коэффициента детерминации факторного признака всегда меньше 50 %. Это означает, что на долю вариации факторного признака xi приходится меньшая доля по сравнению с другими признаками, влияющими на изменение результативного показателя. Синтезированные при таких условиях математические модели связи практического значения не имеют. Поэтому использование корреляционного и регрессионного анализа эффективно в первую очередь для определения взаимозависимости между результативным и факторным показателями при линейной зависимости.
Дата добавления: 2015-03-19; просмотров: 1326;