Необходимые условия применения корреляционного анализа.

Корреляционно-регрессионный анализ

Методические указания к теме

В экономических исследованиях встречаются стохастические зависимости, которые отличаются приблизительностью, неопределенностью. Они наблюдаются только в среднем по значительному количеству объектов (наблюдений). Например, увеличение фондовооруженности труда рабочих дает разный прирост производительности труда на разных предприятиях. Это объясняется тем, что все факторы, от которых зависит производительность труда, действуют в комплексе.

Корреляционная (стохастическая) связь – это неполная зависимость между показателями, которая проявляется только в массе наблюдений.

Различают парную и множественную корреляцию.

Парная корреляция – это связь между двумя показателями, один из которых является факторным, а другой – результативным.

Множественная корреляция возникает от взаимодействия нескольких факторов с результативным показателем.

Основное уравнение связи находят с помощью составления параллельных рядов, группировки данных и линейных графиков. Размещение точек на графике покажет, какая зависимость образовалась между изучаемыми показателями: прямолинейная или криволинейная.

Необходимые условия применения корреляционного анализа.

Наличие достаточно большого количества наблюдений о величине исследуемых факторных и результативных показателей (в динамике или за текущий год по совокупности однородных объектов).

Исследуемые факторы должны иметь количественное изменение и отражение в тех или иных источниках информации.

Этот метод призван решать следующие задачи:

1) Выявить зависимость признаков;

2) Установить форму связи и находить ее аналитическое выражение;

3) Измерять степень тесноты связи;

4) Рассчитывать теоретические уровни;

5) Анализировать результаты.

Первая задача – предполагает логическую обработку первичного материала, отбор фактов, влияющих на результативный признак, выявление зависимостей с помощью метода группировок.

Вторая задача – предполагает измерение степени тесноты связи с помощью коэффициента корреляции с целью суждения об адекватности полученной модели данному экономическому процессу или явлению.

Третья задача – состоит в том, чтобы по полученному уравнению регрессии находить теоретические уровни, т.е. плановые показатели на предстоящий период или прогнозировать развитие явления.

Термин «корреляция» от латинского «correlatio» - соотношение, заимствована из естествознания. Суть в том, что значениям факторного признака соответствуют не строго определенные значения результативного признака, как в функциональных связях, а распределение этих значений,

Термин «регрессия» – заимствовано из биологии, от латинского «regressio» – движение назад.

Корреляционно-регрессионный метод исследования состоит из двух этапов.

Корреляционный метод решает следующие задачи:

-выявить зависимость между признаками;

-установить форму связи и находить ее аналитическое выражение;

-измерять степень тесноты связи.

Регрессионный метод решает следующие задачи:

-дает выражение аналитической форме связи в виде уравнения связи (регрессии);

-на основании этого выражения рассчитываются ожидаемые или планируемые показатели на предстоящий период.

Исходные эмпирические (фактические) данные наносим на графике корреляционного поля и на основании графика делаем вывод о форме связи. На оси абсцисс откладываем факторные значения признака, а на оси ординат результативные. Построив график по эмпирическим значениям обоих признаков, делаем вывод о форме связи, ее направлении, а по разбросу точек – о тесноте связи.

Расположение точек на графике («корреляционное поле») может показать прямую, обратную зависимость или отсутствие зависимости. Графический метод – это самый простой метод определения формы связи.

Прежде чем перейти к построению уравнения регрессии необходимо определить коэффициент корреляции парной или множественной, с тем, чтобы убедиться в необходимости дальнейших расчетов.

Следующим этапом исследования является количественное определение степени влияния факторных признаков на результативный. Мерой существенности влияния являются показатели тесноты связи: линейный коэффициент корреляции (r) при прямолинейной форме связи и корреляционное отношение (n) при криволинейной форме связи, которые дают возможность судить в будущем о соответствии полученной экономико-статистической модели экономическому процессу или явлению.

Линейный коэффициент корреляции обозначается «r» и изменяется при прямой связи от 0 до +1, а при обратной связи – от 0 до –1. О тесноте связи свидетельствует абсолютная величина коэффициента корреляции, Чем теснее связь между признаками, тем ближе к единице будет значение линейного коэффициента корреляции и наоборот. Для качественной оценки связи используется таблица Чеддока.

 

Таблица Чеддока

Значение коэффициента 0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99
Характеристика тесноты связи слабая умеренная заметная высокая весьма высокая

 

При наличии криволинейной связи «r» недооценивает тесноту связи и в некоторых случаях дает неверное представление о степени тесноты связи.

На этом заканчивается первый этап исследования – корреляционный анализ, который позволил определить направление, форму и силу тесноты связи. Результаты корреляционного анализа служат основой для проведения регрессионного анализа, дающего выражение аналитической форме связи в виде построения теоретического уравнения регрессии.

В качестве примера, приведем расчеты выполненные для ЦББ (Центральная Бассейновая больница).

Как правило, исследуемые процессы характеризуются большой сложностью и многообразием, и представляют собой результат действия многих факторов. Поэтому, чтобы отразить это влияние на результативный признак, необходимо производить расчеты на основе методов множественной корреляции. Это очень громоздкие расчеты, но использование современного программного обеспечения позволяет сократить трудоемкость расчетов. Но смысл корреляционно-регрессионного анализа не теряется, если для упрощения расчетов будем исходить из двухфакторного комплекса, т.е. такая постановка задачи выполнена выше. В расчетах будут участвовать два признака, на результативный будет действовать один факторный признак.

При анализе должно выполняться основное условие – качественная и количественная однородность единиц наблюдения, которое обеспечивает получение регрессионной модели, адекватной эмпирическим данным (статистическому материалу).

Выполняются соответствующие расчеты для каждой больницы на статистическом материале за последние 4 года.

Для центральной больницы формируем расчетную таблицу для нахождения линейного коэффициента корреляции и параметров уравнения регрессии.

Расчетная таблица для «r» и уровня регрессии

Х Объем медицинских услуг в койко-днях, тыс. койко-дней У Расходы по заработной плате медперсонала, тыс. руб.     ХУ     Х2     У2     Ух
åХ åУ åХУ åХ2 åУ2  
 

 

Линейный коэффициент корреляции для парной зависимости исчисляется по следующей формуле:

;

где n - количество точек в выборке.

Существуют и другие модификации этой формулы. Подставляя значения в формулу, получим 0,69, что свидетельствует о высокой тесноте связи между изучаемыми признаками, а знак при коэффициенте «плюс» – о прямой связи.

В целях синтезирования модели y от x определите уравнение прямолинейной связи и нанесите полученную при этом теоретическую линию регрессии на график корреляционного поля.

 

Уравнение прямой линии имеет вид:

Ух= ао + а1 х;

где Ух – индивидуальные значения результативного признака;

х - индивидуальные значения факторного признака;

ао, а1 – параметры уравнения регрессии.

Способом наименьших квадратов решим систему нормальных уравнений, находя параметры ао и а1:

Делим каждое уравнение на коэффициенты при ао и получаем:

Путем вычитания из второго уравнения первого получаем:

150 а1 = 510: а1 = 3,4

Подставляя значение а1 в первое уравнение получаем:

Ао+50950 ×3,4 = 37150:ао = -136,080

Уравнение регрессии примет вид:

Ух= - 136,080 + 3,4х

Проверка указана в последней графе таблицы.

Соответствующие расчеты свидетельствуют о тесноте связи между признаками, т.е. о степени адекватности предполагаемой регрессионной модели процессу, который она описывает: ЦББ – 0,69. Линейный коэффициент корреляции изменяется, при прямой связи, от 0 до 1, а она такова, что было доказано построением графиков на корреляционных полях. Чем теснее связь между признаками, тем ближе к единице будет значение коэффициента корреляции. Для качественной оценки тесноты связи используется таблица Чеддока, в соответствии с которой для ЦББ – связь оценивается как высокая.

Таким образом, используя полученную модель, можно достаточно быстро просчитать различные прогнозные варианты затрат по заработной плате в зависимости от различных вариантов объема медицинских услуг.

 

Задание 1.По данным таблицы определить зависимость урожайности зерновых культур (Y) от качества земли (Х).








Дата добавления: 2016-03-22; просмотров: 4296;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.01 сек.