Меры оценки тесноты связи для атрибутивных признаков
Для измерения связи между качественными(атрибутивными) признаками в статистике используются:
— коэффициент сопряженности А.А.Чупрова;
— коэффициент ассоциации К.Пирсона;
— коэффициенты ранговой корреляции Спирмена, Кендалла, Фехнера.
Применение первых двух показателей основано на построении таблиц сопряженности. Расчет этих показателей достаточно сложный и поэтому рассматриваться не будет, хотя дает наиболее точные измерения корреляционной зависимости.
Менее точные, но распространенные ввиду несложности применения, коэффициенты ранговой корреляции.
1. Коэффициент Фехнера рассчитывается на основе сравнения параллельных рядов, с его помощью можно установить направление связи и ее тесноту:

где ∑С — число совпадений знаков отклонения индивидуальных значений от средних значений признаков; ∑Н — число несовпадений.
2. Коэффициент корреляции Спирмена:
где d - разность рангов; n - число наблюдений.
Ранг - порядковый номер упорядоченного по убыванию или возрастанию ряда значений признака.
3. Коэффициент ранговой корреляции Кендалла:
P и Q — определяются для неупорядоченного ряда (ряд результативного признака у);
Р равен сумме рангов, больших, чем взятый ранг (со знаком +);
Q равно сумме рангов, меньших, чем взятый ранг (со знаком -).
Пример расчета коэффициентов Фехнера, Спирмена, Кендалла.
В таблице 4 имеются два параллельных ряда преступлений и правонарушений. Предположим, что чем больше правонарушений, тем выше число преступлений, то есть число правонарушений является свидетельством более высокой преступности. Ряд числа правонарушений обозначим за х (фактор), а ряд числа преступлений за у (результат). Оценим взаимосвязь между признаками с помощью коэффициентов Фехнера, Спирмена и Кендалла.
Таблица 4
| № н/п | Правонарушения (jc) | Преступления (у) | По Фехнеру | По Спирмену | ||||
| знаки отклонения от средней | ранги по признакам | разность рангов | ||||||
| X | У | X | У | d | d2 | |||
| - | - | 4 j | ||||||
| - | - | |||||||
| - | - | 1. | ||||||
| + | + | |||||||
| + | - | |||||||
| + | + | |||||||
| + | + | |||||||
| 65,3 | 7,4 |
1. Рассчитаем коэффициент Фехнера:

По данным таблицы 4 сравниваем 4 и 5 графы, в которых отражены знаки отклонений от средних, и считаем число совпадений знаков и несовпадений. Например, несовпадение знаков только в пятой строке, по всем остальным строкам знаки совпадают: либо оба положительные, либо отрицательные.

Коэффициент Фехнера изменяется от +1 до -1. Значение коэффициента близко к единице, что свидетельствует о существенной прямой согласованности в изменении признаков. Связь между числом правонарушений и числом преступлений сильная.
2. По данным таблицы 4 рассчитаем коэффициент Спирмена. Ряд х (правонарушения) проранжируем (упорядочим) по возрастанию (гр. 6), затем проставим ранги по ряду у, не меняя значения местами (гр. 7). Найдем разницу между рангами и возведем в квадрат (гр. 8, 9).


Расчет коэффициента Спирмена также подтверждает наличие сильной связи между признаками.
3. Рассчитаем коэффициент ранговой корреляции Кендалла по данным таблицы 4, расчет представим в таблице 5.
Р и Q — определяются для неупорядоченного ряда (в нашем случае это ряд у).
Р равен сумме ниже расположенных рангов, больших, чем взятый ранг (со знаком +), например: берем первый ранг - 3 и считаем, сколько расположенных ниже значений рангов превышают значение первого, равного 3, записываем в графе Р 4, берем следующий, равный 2, считаем нижние значения, превышающие 2, и т.д.
Q равно сумме рангов, меньших, чем взятый ниже ранг (со знаком -), рассчитываем аналогично:
Таблица 5
| № п/п | Ранг у | Р | Q | S | |
| -2 | |||||
| % | -1 | ||||
| . 5 | -1 | ||||
| Итого | - | - | - |

На основании коэффициента Кендалла можно сделать вывод об умеренной связи между признаками.
При расчете различных измерителей корреляционной связи на основании одних и тех же
данных мы получаем разные результаты. Это говорит не о том, что мы получили неверные результаты, а об условности измерителей.
По степени тесноты связи различают следующие количественные критерии оценки тесноты связи:
| Коэффициент корреляции | Характер связи |
| до 0,3 | практически отсутствует |
| 0,3—0,5 | слабая |
| 0,5—0,7 | умеренная |
| 0,7—1,0 | сильная |
Для таблиц сопряженности 2x2 (табл. 6) разработаны более простые меры связей, так называемые коэффициенты ассоциации и контингенции.
Таблица 6
| x1 | х2 | ||
| У1 | а | b | a+b |
| У2 | с | d | c+d |
| а+с | b+d | n=a+b+c+d |
В таблицах сопряженности 2x2 признак х и признак у принимает только по два значения. Коэффициент ассоциации:
,
Коэффициент контингенции:
Коэффициент контингенции дает более строгую оценку тесноты связи. Считается, что можно делать вывод о существовании связи между признаками, при коэффициенте ассоциации, равном 0,5, или коэффициенте контингенции, равном 0,3.
Пример расчета коэффициентов ассоциации и контингенции.
Для установления связи между полом и уровнем образования обследованы 60 мужчин и 60 женщин (табл. 7).
Таблица 7
| Пол/образование | Среднее и среднее специальное | Высшее | Итого |
| Женский | |||
| Мужской | |||
| Всего |


На основании коэффициентов делаем вывод о существовании связи между уровнем образования и полом.
В заключение следует обратить внимание, что нельзя даже самые точные расчеты абсолютизировать, так как даже самый высокий коэффициент корреляции еще ничего не говорит о действительной причинной связи между явлениями. Их расчет является лишь лишним подтверждением наличия связи, вывод о которой делается на уровне теоретического, качественного анализа.
Выводы:
1. Изучение взаимосвязей между явлениями позволяет не только объяснить изменения, исходящие в одних явлениях под влиянием других, но и дает возможность управлять процессами, зная механизм их взаимодействия.
2. Как правило, в статистике изучается стохастическая зависимость, то есть зависимость, которая проявляется в большинстве случаев, а не в каждом единичном случае.
3. Конечной целью изучения взаимосвязей является прогнозная оценка развития явления. Оценка силы и тесноты связи между количественными признаками осуществляется помощи корреляционно-регрессионного анализа.
4. Оценка связи между качественными признаками осуществляется при помощи непараметрических мер связей, основанных на таблицах сопряженности.
Дата добавления: 2016-12-16; просмотров: 1327;
