Коэффициент корреляции Пирсона
Использование коэффициента корреляции Пирсона для оценки степени связи между двумя признаками предполагает выполнение следующих двух обязательных условий:
1. Значения обоих анализируемых признаков распределены нормально.
2. Связь между признаками является линейной.
Предположим, необходимо выяснить наличие связи между индексом реального валового внутреннего продукта (ВВП) на душу населения и остальными индексами, в представленных экспериментальных данных.
Для расчета коэффициента корреляции Пирсона необходимо выполнить следующее:
1. Запустить модуль анализа из меню «Statistics/Basic Statistics/Tables/Correlation Matrices (Корреляционные матрицы).
2. В появившемся окне выбрать переменные, которые должны участвовать в анализе. Для этого нужно нажать либо кнопку «One variable list» (Один список переменных) либо «Two lists (rect. matrix)» (Два списка (прямоугольная матрица)). В первом случае анализируемые переменные последовательно выбираются из одного списка, а во втором – из двух.
3. Проверить условия применимости коэффициента Пирсона. Для визуальной оценки выполнения этих условий можно нажать кнопку «Scatterplot matrix for selected variables» (Диаграмма рассеяния для выбранных переменных). В результате программа построит точечный график, по осям которого будут отложены значения соответствующих переменных (рис.5.11). Диагональная линия на этом графике служит для оценки линейности связи между анализируемыми признаками. Если точки-наблюдения укладываются вдоль этой линии на близком расстоянии, можно говорить о существовании прямолинейной зависимости. Вместе с диаграммой рассеяния программа строит также распределения значений анализируемых признаков в виде гистограмм, по форме которых можно проверить условие о нормальности распределения.
Примечание |
В рассматриваемом примере условие нормальности распределения явно не выполняется у некоторых факторов (ID_EDUCATION, ID_DEVELOPMENT), однако в учебных целях продолжен расчет коэффициента корреляции Пирсона. |
Рисунок 5.11. Диаграмма рассеяния для выбранных переменных
4. Нажать на кнопку «Summary: Correlations» (Результат: Корреляционная матрица). В результате появится таблица, содержащая рассчитанный программой коэффициент корреляции (рис.5.12). Статистически значимые коэффициенты корреляции Пирсона в ППП Statistica выделяются красным цветом (Р > 0,05).
Рисунок 5.12. Корреляционная матрица по критерию Пирсона
Дата добавления: 2015-01-13; просмотров: 1174;