ТЕМА 1.8. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗЕЙ
1.8.1. Статистическое изучение взаимосвязей, их классификация.
1.8.2. Задачи изучения взаимосвязей.
1.8.3. Понятие корреляционно-регрессионного анализа, условия его применения.
1.8.4. Показатели тесноты связи, линейный коэффициент корреляции.
1.8.5. Меры оценки тесноты связи для атрибутивных признаков.
1.8.1. Статистическое изучение взаимосвязей, их классификация
Статистическое изучение взаимосвязей является одним из важнейших разделов статистики. Изучение взаимосвязей между различными явлениями общественной жизни позволяет предсказывать развитие процессов, зависимых от других, и, в конечном счете, оказывать на них влияние. Таким образом, изучение связей позволяет от объяснения фактов перейти к изменению фактов.
Взаимосвязь — это совместное согласованное изменение двух или нескольких признаков.
Присутствие взаимосвязи между различными явлениями, процессами выражается во взаимосогласованном изменении статистических данных, описывающих эти процессы.
Например, стаж работы является одним из факторов роста производительности труда. Поэтому увеличение стажа, как правило, приводит к росту выработки. Статистические данные отражают согласованность в изменении обоих показателей.
Все многообразие взаимосвязей принято классифицировать по различным признакам: Форма проявления:
причинно-следственные связи — в том случае, когда из двух взаимодействующих признаков можно выделить причину и следствие, признак-фактор (х) и признак-результат (х).
Например, взаимосвязь между объемом производимой продукции и себестоимостью единицы продукции проявляется следующим образом: с увеличением объема производимой продукции себестоимость единицы продукции снижается. Здесь, объем продукции — признак-фактор, а себестоимость — признак результат.
Связи соответствия — в случае, когда нет возможности выделить причину и следствие, в частности оба согласованно меняющихся признака являются следствиями третьего признака. Механизм связи:
— функциональная;
— стохастическая (статистическая).
Под функциональной зависимостьюмежду явлениями понимается такая связь, которая может быть выражена для каждого случая вполне определенно строгой математической формулой. При функциональной зависимости каждому значению одной величины соответствует одно или несколько, но вполне определенных значений другой величины. Например, отношения между стороной и площадью квадрата (S = а2 ), временем и путем при движении с постоянной скоростью (S = vt) и тому подобными величинами, часто встречающимися в геометрии, механике. Для массовых социальных явлений характерны зависимости другого рода, возникающие в результате взаимодействия многих причин и условий и осложненные действием объективной случайности и ошибок наблюдения. Выразить подобные зависимости с помощью однозначных, точных формул, пригодных для описания каждого отдельного случая невозможно.
При статистической связиразным значениям одной переменной соответствуют разные распределения значений другой переменной.
Частным случаем статистической связи является корреляционная связь.
Корреляционная зависимость— взаимосвязь между признаками, состоящая в том, что средняя величина значений одного признака меняется в зависимости от изменения другого признака (например, зависимость между выработкой и стажем работы, между числом судимостей преступника и временем его нахождения на свободе между ними и др.). Здесь, в отличие от функциональной зависимости, в индивидуальных случаях при определении значения одного признака могут быть разные значения другого, то есть совсем не обязательно, что обнаруженная связь будет подтверждаться в каждом конкретном случае.
Например, изменение профессорско-преподавательского состава в сторону увеличения числа
преподавателей, имеющих ученую степень, приводит в конечном итоге к повышению качества образования. Но это не значит, что каждый отдельно взятый выпускник будет обладать большим набором знаний, чем выпускник учебного заведения, имеющего более «слабый» преподавательский состав.
Следовательно, в статистическом анализе корреляционные зависимости проявляются не между каждой парой сопоставляемых данных, а между изменениями в рядах распределения множества соответствующих величин.
Кроме того, что корреляционная зависимость не имеет функционального характера, следует учитывать две ее особенности:
— вывод может быть сделан только на основе анализа достаточно больших статистических совокупностей, позволяющих по строить относительно длинные статистические ряды;
— желательно, чтобы число наблюдений было не менее чем в 5-6 раз больше числа факторов.
Корреляционный анализ имеет смысл лишь в тех случаях, когда возможность причинной связи между анализируемыми признаками теоретически обоснована хотя бы на уровне содержательной гипотезы.
Если с изменением значения признака среднее значение другого признака не изменяется закономерным образом, но закономерно изменяется другая статистическая характеристика (например, показатели вариации), то связь не является корреляционной, но является статистической.
В случае статистической связи предполагается, что оба признака имеют случайную вариацию индивидуальных значений относительно средней величины, то есть каждый из признаков принимает несколько случайных значений. В том случае, если такую вариацию имеет один из признаков, а значения другого являются жестко детерминированными, то говорят о регрессии,но не о статистической связи. При анализе динамических рядов можно измерять регрессию уровней ряда (имеющих случайную колеблемость) на номера лет. Например, динамика производства продукции. Но, нельзя говорить о корреляции (взаимосвязи) между выпуском продукции и временем и оценивать между ними тесноту связи.
Направление связи:
— прямые;
— обратные.
В том случае, если при увеличении признака-фактора растет признак-результат, говорят о прямой корреляционной связи. Например, чем выше уровень алкоголизации общества, тем выше преступность, причем преступность специфичная («пьяная»). Если при увеличении признака-причины уменьшается признак-результат, говорят об обратной корреляционной зависимости. Например, чем выше социальный контроль в обществе, тем ниже преступность.
Форма связи:
— прямолинейные;
— криволинейные.
И прямые, и обратные связи могут быть прямолинейными и криволинейными. Математически прямолинейные связи могут быть описаны с помощью уравнения прямой:
y = а + вх,
где у — признак-результат; х — признак-фактор.
Криволинейные связи носят иной характер. Возрастание величины факторного признака оказывается неравномерное влияние на величину результирующего признака.
Например, связь преступлений с возрастом нарушителей. Вначале криминальная активность лиц растет прямо пропорционально увеличению возраста (приблизительно до 30 лет), а затем начинает снижаться. Математически такие связи описываются с помощью кривых (гиперболы, параболы).
Прямолинейные корреляционные связи могут быть однофакторными, когда исследуется связь между одним признаком-фактором и одним признаком-следствием {парная корреляция). Они могут быть многофакторными, когда исследуется влияние многих взаимодействующих между собой признаков-факторов на признак-следствие (множественная корреляция).
Дата добавления: 2016-12-16; просмотров: 2702;