Методика множественного корреляционного анализа
Необходимость применения многофакторного корреляционного анализа. Этапы многофакторного корреляционного анализа. Правила отбора факторов для корреляционной модели. Обоснование необходимого объема выборки данных для корреляционного анализа. Сбор и статистическая оценка исходной информации. Способы обоснования уравнения связи. Основные показатели связи в корреляционном анализе и их интерпретация. Сущность парных (общих), частных и множественных коэффициентов корреляции и детерминации. Оценка значимости коэффициентов корреляции. Порядок расчета уравнения множественной регрессии шаговым способом. Интерпретация его параметров. Назначение коэффициентов эластичности и стандартизированных бетта-коэф-фициентов.
Экономические явления и процессы хозяйственной деятельности предприятий зависят от большого количества факторов. Как правило, каждый фактор в отдельности не определяет изучаемое явление во всей полноте. Только комплекс факторов в их взаимосвязи может дать более или менее полное представление о характере изучаемого явления.
Многофакторный корреляционный анализ состоит из нескольких этапов.
На первом, этапе определяются факторы, которые оказывают воздействие на изучаемый показатель, и отбираются наиболее существенные для корреляционного анализа.
На втором этапе собирается и оценивается исходная информация, необходимая для корреляционного анализа.
На третьем этапе изучается характер и моделируется связь между факторами и результативным показателем, то есть подбирается и обосновывается математическое уравнение, которое наиболее точно выражает сущность исследуемой зависимости.
На четвертом этапе проводится расчет основных показателей связи корреляционного анализа.
На пятом этапе дается статистическая оценка результатов корреляционного анализа и практическое их применение.
Отбор факторов для корреляционного анализа является очень важным моментом в экономическом анализе. От того, насколько правильно он сделан, зависит точность выводов по итогам анализа. Главная роль при отборе факторов принадлежит теории, а также практическому опыту анализа. При этом необходимо придерживаться следующих правил.
1. При отборе факторов в первую очередь следует учитывать причинно-следственные связи между показателями, так как только они раскрывают сущность изучаемых явлений. Анализ же таких факторов, которые находятся только в математических соотношениях с результативным показателем, не имеет практического смысла.
2. При создании многофакторной корреляционной модели необходимо отбирать самые значимые факторы, которые оказывают решающее воздействие на результативный показатель, так как охватить все условия и обстоятельства практически невозможно. Факторы, которые имеют критерий надежности по Стьюденту меньше табличного, не рекомендуется принимать в расчет.
3. Все факторы должны быть количественно измеримы, т.е. иметь единицу измерения, и информация о них должна содержаться в учете и отчетности.
4. В корреляционную модель линейного типа не рекомендуется включать факторы, связь которых с результативным показателем имеет криволинейный характер.
5. Не рекомендуется включать в корреляционную модель взаимосвязанные факторы. Если парный коэффициент корреляции между двумя факторами больше 0,85, то по правилам корреляционного анализа один из них необходимо исключить, иначе это приведет к искажению результатов анализа.
6. Нежелательно включать в корреляционную модель факторы, связь которых с результативным показателем носит функциональный характер.
Большую помощь при отборе факторов для корреляционной. модели оказывают аналитические группировки, способ сопоставления параллельных и динамических рядов, линейные графики. Благодаря им можно определить наличие, направление и форму зависимости между изучаемыми показателями. Отбор факторов можно производить также в процессе решения задачи корреляционного анализа на основе оценки их значимости по критерию Стьюдента, о котором будет сказано ниже.
Исходя из перечисленных выше требований и используя названные способы отбора факторов,для многофакторной корреляционной модели уровня рентабельности (Y) подобраны. следующие факторы, которые оказывают наиболее существенное влияние на ее уровень:
x1 - материалоотдача, руб.;
x2 - фондоотдача, коп.;
x3 - производительность труда (среднегодовая выработка продукции на одного работника), млн руб.;
x4 - продолжительность оборота оборотных средств предприятия, дни;
x5 - удельный вес продукции высшей категории качества, %.
Поскольку корреляционная связь с достаточной выразительностью и полнотой проявляется только в массе наблюдений, объем выборки данных должен быть достаточно большим, так как только в массе наблюдений сглаживается влияние других факторов. Чем большая совокупность объектов исследуется, тем точнее результаты анализа.
Учитывая это требование, влияние перечисленных факторов на уровень рентабельности исследуется на примере 40 предприятий.
Следующим этапом анализа являетсясбор и статистическая оценка исходной информации, которая будет использоваться в корреляционном анализе. Собранная исходная информация должна быть проверена на достоверность, однородность и соответствие закону нормального распределения.
В первую очередь необходимо убедиться вдостоверности информации, насколько она соответствует объективной действительности. Использование недостоверной, неточной информации приведет к неправильным результатам анализа и выводам.
Одно из условий корреляционного анализа -однородность исследуемой информации относительно распределения ее около среднего уровня. Если в совокупности имеются группы объектов, которые значительно отличаются от среднего уровня, то это говорит о неоднородности исходной информации.
Критерием однородности информации служит среднеквадратическое отклонение и коэффициент вариации, которые рассчитываются по каждому факторному и результативному показателю.
Среднеквадратическое отклонение показывает абсолютное отклонение индивидуальных значений от среднеарифметического. Оно определяется по формуле:
Коэффициент вариации характеризует относительную меру отклонения отдельных значений от среднеарифметической. Он рассчитывается по формуле:
Чем больше коэффициент вариации, тем относительно больший разброс и меньшая выравненность изучаемых объектов. Изменчивость вариационного ряда принято считать незначительной, если вариация не превышает 10 %, средней - если составляет 10-20 %, значительной - если она больше 20 %, но не превышает 33 %. Если же вариация выше 33 %, то это говорит о неоднородности информации и необходимости исключения нетипичных наблюдений, которые обычно бывают в первых и последних ранжированных рядах выборки.
В нашем примере (табл. 7.4) самая высокая вариация по х5 (V = 22,98), но она не превышает 33 %. Значит, исходная информация является однородной и ее можно использовать для дальнейших расчетов.
На основании самого высокого показателя вариации можно определитьнеобходимый объем выборки данных для корреляционного анализа по следующей формуле:
где п - необходимый объем выборки данных; V - вариация, %; t - показатель надежности связи, который при уровне вероятности Р = 0,05 равен 1,96; т - показатель точности расчетов (для экономических расчетов допускается ошибка 5-8 %).
Значит, принятый в расчет объем выборки (40 предприятий) является достаточным для проведения корреляционного анализа.
Следующее требование к исходной информации -соответствие ее закону нормального распределения. Согласно этому закону, основная масса исследуемых сведений по каждому показателю должна быть сгруппирована около ее среднего значения, а объекты с очень маленькими значениями или с очень большими должны встречаться как можно реже. График нормального распределения информации имеет следующий вид (рис. 7.1).
Для количественной оценки степени отклонения информации от нормального распределения служит отношение показателя асимметрии к ее ошибке и отношение показателя эксцесса к его ошибке.
Показатель асимметрии (A) и его ошибка (та) рассчитываются по следующим формулам:
Показатель эксцесса (Е) и его ошибка (те) рассчитываются следующим образом:
В симметричном распределении А = 0. Отличие от нуля указывает на наличие асимметрии в распределении данных около средней величины. Отрицательная асимметрия свидетельствует о том, что преобладают данные с большими значениями, а с меньшими значениями встречаются значительно реже. Положительная асимметрия показывает, что чаще встречаются данные с небольшими значениями.
В нормальном распределении показатель эксцесса Е = 0. Если Е > 0, то данные густо сгруппированы около средней, образуя островершинность. Если Е < О, то кривая распределения будет плосковершинной. Однако, когда отношения А/та и Е/те меньше 3, то асимметрия и эксцесс не имеют существенного значения и исследуемая информация подчиняется закону нормального распределения.
В нашем примере (табл. 7.4) во всех случаях отношения А/та и Е/те не превышают 3. Значит, исходная информация соответствует этому закону.
После отбора факторов и оценки исходной информации важной задачей в корреляционном анализе являетсямоделирование связи между факторными и результативными показателями, т.е. подбор соответствующего уравнения, которое наилучшим образом описывает изучаемые зависимости.
Для его обоснования используются те же приемы, что и для установления наличия связи: аналитические группировки, линейные графики и др. Если связь всех факторных показателей с результативным носит прямолинейный характер, то для записи этих зависимостей можно использовать линейную функцию:
Если связь между результативным и факторными показателями носит криволинейных характер, то может быть использована степенная функция:
или логарифмическая:
Приведенные модели выгодны тем, что их параметрам (bi) можно дать экономическое объяснение (интерпретацию). В линейной модели коэффициенты bi показывают, на сколько единиц изменяется результативный показатель с изменением факторного на единицу в абсолютном выражении, в степенных и логарифмических - в процентах.
В случаях, когда трудно обосновать форму зависимости, решение задачи можно провести по разным моделям и сравнить полученные результаты. Адекватность разных моделей фактическим зависимостям проверяется по критерию Фишера, показателю средней ошибки аппроксимации и величине множественного коэффициента детерминации, о которых речь пойдет несколько позже (см. § 7.4).
Изучение взаимосвязей между исследуемыми факторами и уровнем рентабельности показало, что все зависимости в нашем примере имеют прямолинейный характер. Поэтому для их описания использована линейная функция.
Решение задачи многофакторного корреляционного анализа проводится на ПЭВМ по типовым программам. Сначала формируется матрица исходных данных (табл. 7.5), в первой колонке которой записывается порядковый номер наблюдения, во второй - результативный показатель (Y), а в следующих - факторные показатели (хi).
Эти сведения вводятся в ПЭВМ и рассчитываются матрицы парных и частных коэффициентов корреляции, уравнение множественной регрессии, а также показатели, с помощью которых оценивается надежность коэффициентов корреляции и уравнения связи: критерий Стьюдента, критерий Фишера, средняя ошибка аппроксимации, множественные коэффициенты корреляции и детерминации.
Изучая матрицы парных и частных коэффициентов корреляции, можно сделать вывод о тесноте связи между изучаемыми явлениями.Коэффициенты парной корреляции характеризуют тесноту связи между двумя показателями в общем виде с учетом взаимосвязей факторов, оказывающих воздействие на результативный показатель.
Данные табл. 7.6 (первый столбец) свидетельствуют о том, что все факторы оказывают ощутимое воздействие на уровень рентабельности. Особенно тесная связь рентабельности с материалоотдачей, фондоотдачей, качеством продукции и производительностью труда. С увеличением данных показателей уровень рентабельности повышается (прямая связь). При увеличении продолжительности оборота средств рентабельность снижается (обратная связь).
Однако необходимо отметить, что парные коэффициенты корреляции получены при условии воздействия других факторов на результат. Чтобы абстрагироваться от их влияния и получить количественную характеристику связи между результативным и факторными показателями в чистом виде, рассчитываютсячастные коэффициенты корреляции (табл. 7.7).
При сравнении частных коэффициентов корреляции с парными видно, что влияние других факторов на тесноту связи между уровнем рентабельности и исследуемыми факторами довольно значимое: частные коэффициенты корреляции намного ниже парных. Это говорит о том, что факторы, которые входят в данную корреляционную модель, оказывают на рентабельность не только непосредственное влияние, но и косвенное. Поэтому взаимосвязи, очищенные от влияния сопутствующих факторов, получились менее тесными. В некоторых случаях они могут оказаться более тесными, если исключить влияние факторов, которые действуют в противоположном направлении. По этой причине может измениться не только величина коэффициента корреляции, но и направление связи: в общем виде связь может быть прямой, а в чистом — обратной, и наоборот. Объясняется это тем, что при расчете парных коэффициентов корреляции изучается взаимосвязь между результативным и факторным показателем с учетом их взаимодействия и с другими факторами. Например, с повышением уровня оплаты труда рентабельность увеличивается, если темпы роста производительности труда обгоняют темпы роста его оплаты. Поэтому в общем виде взаимосвязь между уровнем рентабельности и уровнем оплаты труда будет прямой. Если взять непосредственную связь между этими показателями при условии неизменности производительности труда и других факторов, то получится, что при повышении оплаты труда рентабельность понижается. Здесь уже обратная зависимость и частный коэффициент корреляции будет со знаком минус.
Таким образом, с помощью парных и частных коэффициентов корреляции можно получить представление о тесноте связи между изучаемыми явлениями в общих и непосредственных соприкосновениях.
Значительный интерес представляют коэффициенты корреляции, характеризующие взаимосвязь факторов между собой. Как уже отмечалось, в корреляционную модель надо подбирать независимые между собой факторы. Если коэффициент корреляции двух факторов выше 0,85, то один из них необходимо исключить из модели. Исследование матрицы коэффициентов корреляции позволяет сделать вывод, что в данную модель включены факторы, не очень тесно связанные между собой.
При изучении тесноты связи надо иметь в виду, что величина коэффициентов корреляции является случайной, зависящей от объема выборки. Известно, что с уменьшением количества наблюдений надежность коэффициентов корреляции падает, и наоборот, при увеличении количества наблюдений надежность коэффициентов корреляции возрастает.
Значимость коэффициентов корреляции проверяемся по критерию Стьюдента:
где - среднеквадратическая ошибка коэффициента корреляции, которая определяется по формуле:
Если расчетное значение ( выше табличного, то можно сделать заключение о том, что величина коэффициента корреляции является значимой. Табличные значения t находят по таблице значений критериев Стьюдента. При этом учитываются количество степеней свободы (V = п — 1)и уровень доверительной вероятности (в экономических расчетах обычно 0,05 или 0,01). В нашем примере количество степеней свободы равно: п — 1 = 40 - 1 = 39. При уровне доверительной вероятности Р = 0,05; t = 2,02. Поскольку (фактическое (табл. 7.8) во всех случаях выше t-табличного, связь между результативным и факторными показателями является надежной, а величина коэффициентов корреляции - значимой.
Следующий этап корреляционного анализа —расчет уравнения связи (регрессии). Решение проводится обычно шаговым способом. Сначала в расчет принимается один фактор, который оказывает наиболее значимое влияние на результативный показатель, потом второй, третий и т.д. И на каждом шаге рассчитываются уравнение связи, множественный коэффициент корреляции и детерминации, F-отношение (критерий Фишера), стандартная ошибка и другие показатели, с помощью которых оценивается надежность уравнения связи. Величина их на каждом шаге сравнивается с предыдущей. Чем выше величина коэффициентов множественной корреляции, детерминации и критерия Фишера и чем ниже величина стандартной ошибки, тем точнее уравнение связи описывает зависимости, сложившиеся между исследуемыми показателями. Если добавление следующих факторов не улучшает оценочных показателей связи, то надо их отбросить, т.е. остановиться на том уравнении, где эти показатели наиболее оптимальны.
Сравнивая результаты на каждом шаге (табл.7.9), мы можем сделать вывод, что наиболее полно описывает зависимости между изучаемыми показателями пятифакторная модель, полученная на пятом шаге. В результате уравнение связи имеет вид:
Коэффициенты уравнения показывают количественное воздействие каждого фактора на результативный показатель при неизменности других. В данном случае можно дать следующую интерпретацию полученному уравнению: рентабельность повышается на 3,65 % при увеличении материалоотдачи на 1 руб.; на 0,09 % - с ростом фондоотдачи на 1 коп.; на 1,02 %-с повышением среднегодовой выработки продукции на одного работника на 1 млн руб.; на 0,052 %- при увеличении удельного веса продукции высшей категории качества на 1 %. С увеличением продолжительности оборота средств на 1 день рентабельность снижается в среднем на 0,122 %.
Коэффициенты регрессии в уравнении связи имеют разные единицы измерения, что делает их несопоставимыми, если возникает вопрос о сравнительной силе воздействия факторов на результативный показатель. Чтобы привести их в сопоставимый вид, все переменные уравнения регрессии выражают в долях среднеквадратического отклонения, другими словами, рассчитывают стандартизированные коэффициенты регрессии. Их еще называют бетта-коэффициентами по символу, который принят для их обозначения (р).
Бетта-коэффициенты и коэффициенты регрессии связаны следующим отношением:
Бетта-коэффициенты показывают, что если величина фактора увеличится на одно среднеквадратическое отклонение, то соответствующая зависимая переменная увеличится или уменьшится на долю своего среднеквадратического отклонения. Сопоставление бетта-коэффициентов позволяет сделать вывод о сравнительной степени воздействия каждого фактора на величину результативного показателя. В нашем примере наибольшее влияние на уровень рентабельности оказывают материа-лоотдача, фондоотдача и производительность труда (табл. 7.10).
По аналогии можно сопоставить и коэффициенты эластичности, которые рассчитываются по формуле:
Коэффициенты эластичности показывают, на сколько процентов в среднем изменяется функция с изменением аргумента на 1 %.
Согласно данным табл. 7.10, рентабельность возрастает на 0,374% при увеличении уровня материалоотдачи на 1%, на 0,308 % - при повышении фондоотдачи на 1 % и т.д.
Дата добавления: 2015-10-13; просмотров: 1409;