Корреляция рядов динамики
В главах, посвященных статистическому изучению взаимосвязей методом аналитической группировки и методом корреляционного анализа, рассматривались зависимости между признаками, варьирующими в пространственной совокупности. Но необходимо изучать и связи, проявляющиеся в развитии, во времени. Например, есть ли связь между изменениями урожайности сельскохозяйственных культур и изменениями ее себестоимости, рентабельности? Есть ли связь между динамикой рождаемости и динамикой обеспеченности населения жильем? К сожалению, проблема изучения причинных связей во времени очень сложна, и полное решение всех задач такого изучения до сих пор не разработано.
Характерным примером для иллюстрации особенностей методики анализа корреляции в рядах динамики служит связь динамики урожайности сельскохозяйственных культур с себестоимостью продукции в 70 - 80-е гг. в СССР. Официально тогда, не признавалось наличие инфляции. Однако, даже в тех хозяйствах, где агротехника прогрессировала и урожайность имела тенденцию роста, себестоимость продукции тоже возрастала. Такой пример представлен в табл.9.12.
Основная сложность состоит в том, что, как показано в предыдущем разделе главы, при наличии тренда за достаточно длительный период большая часть суммы квадратов отклонений связана с трен-дом. Если два признака имеют тренды с одинаковым направлением изменения уровней, то между уровнями этих признаков будет наблюдаться положительная ковариация. И в одном, и в другом ряду уровни более поздних лет будут либо больше, либо меньше уровней более ранних периодов. Коэффициент корреляции уровней окажется положительным. При разной направленности трендов ковариация уровней и коэффициент их корреляции окажутся отрицательными.
Но ведь одинаковая направленность трендов вовсе не означает причинной зависимости. Например, рост производства ракет не причина происходившего в тот же период роста производства мяса. Гораздо вероятнее, что при отсутствии гонки производства ракетного оружия производство мяса росло бы значительно быстрее. А коэффициенты корреляции уровней высоки! Таким образом, не только, возникает масса «ложных корреляций», за которыми нет причинной зависимости, но искажаются (преувеличиваются или преуменьшаются) и те показатели корреляции, за которыми стоят реальные причинные зависимости.
Рассмотрим табл. 9.12. Корреляция уровней урожайности с уровнями себестоимости картофеля отсутствует: коэффициент корреляции равен -0,055, т. е. незначимо отличен от нуля. Но ведь на самом деле по законам экономики, при пространственной корреляции в совокупности хозяйств связь урожайности и себестоимости сильная, обратная.
Среднее значение урожайности по данным табл. 9.12 составило х̅ = 119,92 ц/га, себестоимость у̅ = 19,0 руб./ц. Уравнения трендов урожайности х̂ = 119,9 + 3,81t, себестоимости у̂ = 19,0 + 1,22t, t = 0 в 1983 г.
Всесторонний экономический и статистико-математический анализ ситуации показывает, что причина отсутствия корреляции уровней в том, что оба признака имеют одинаково направленные тренды - возрастание урожайности происходило параллельно с возрастанием себестоимости, вовсе не являясь причиной последнего! Себестоимость росла из-за инфляции в стране, влияние которой оказалось сильнее, чем направленное на снижение себестоимости влияние роста урожайности.
Если же рассматривать уровни признаков год за годом, легко заметить, что без исключений снижению урожайности в сравнении с предыдущим годом соответствовал ростсебестоимости, а повышению урожайности - ее снижение, т.е. связь обратная, которая и должна быть. Следовательно, чтобы получить реальные показатели корреляции, необходимо абстрагироваться, от искажающего влияния трендов: вычислить отклонения уровней урожайности и себестоимости от трендов и измерить корреляцию не уровней, а колебаний двух признаков. Подставляя в формулу парного коэффициента корреляции (8.11) вместо уровней признаков их отклонения от трендов , получаем:
(9.51)
Однако среднее отклонение от тренда равно нулю (для прямой и параболы всегда, а для других типов тренда лишь в том случае, если правильно отражают тенденцию), = =0. Подставив в (9.51), получим:
(9.52)
Коэффициент регрессии для линейной зависимости принимает вид:
(9.53)
Свободный член линейного уравнения регрессии
а = u̅y = bu̅x = 0.
Регрессионное уравнение отклонений от тренда имеет вид:
ũy = bи̃x (9.54)
По данным табл. 9.12 коэффициент корреляции уровней урожайности и себестоимости
Прямая связь одинаково направленных трендов почти полностью компенсировала обратную связь между колебаниями признаков. Из 13 произведений семь положительны. Прежде всего в начале и в конце ряда, где'сильнее всего сказались тренды. Если бы не страшный неурожай в 1987 г., вызвавший огромные отклонения уровней, коэффициент корреляции был бы даже положителен.
Напротив, корреляция отклонений от трендов дает результат, соответствующий экономическому содержанию связи урожайности с себестоимостью.Коэффициент корреляции отклонений от трендов по формуле (9.52) составил:
Коэффициент детерминации равен 0,88, или 88% колебаний себестоимости картофеля связаны с колебаниями урожайности. Положительны лишь три произведения отклонения , притом наименьшие.
Коэффициент регрессии по формуле (9.53)
Уравнение регрессии:
.
Это означает, что в среднем за период отклонение себестоимости от тренда было противоположно по знаку и составляло 0,124 отклонения урожайности от своего тренда. Если, например, урожайность в 1993 г. окажется на 20 ц/га ниже уровня тренда для этого года, составляющего 119,9 +3,81·10 = 158 ц/га, то себестоимость надо ожидать на -20(- 0,124) = 2,48 руб. за 1 ц выше уровня тренда, который для 1993 г. равен 31,2 руб. за 1 ц, т.е., учитывая и тренды, и предполагаемый плохой урожай в 1993 г., себестоимость картофеля составила бы 31,2 + 2,48 = 33,66 руб./ц. Естественно, что этот прогноз всего лишь пример, как пользоваться уравнением регрессии отклонений от тренда. В нашем случае метеорология не дает оснований для прогноза урожайности, а сильнейшая инфляция делает вообще невозможным любой прогноз себестоимости без использования дефлятора (см. гл. 10).
Данные табл. 9.12 позволяют сделать интересное заключение о различии характера динамики признаков. Если из общей дисперсии (суммы квадратов отклонений от среднего уровня) урожайности 10341 большую часть составляет дисперсия за счет колеблемости 7678, то для себестоимости преобладающим моментом общей дисперсии, равной 405,16, является не колеблемость, дающая только 133,34, а тренд; это эффект скрытой инфляции до 1989 г.
Другим приемом измерения корреляции в рядах динамики может служить корреляция между теми из цепных показателей рядов, которые являются константами их трендов. При линейных трен-дах - это цепные абсолютные приросты. Вычислив их по исходным рядам динамики (аxi,, аyi), находим коэффициент корреляции между абсолютными изменениями по формуле (9.52) или, что более точно, по формуле (9.51), так как средние изменения не равны нулю в отличие от средних отклонений от трендов. Допустимость данного способа основана на том, что разность между соседними уровнями в основном состоит из колебаний, а доля тренда в них невелика, следовательно, искажение корреляции от тренда очень большое при кумулятивном эффекте на протяжении длительного периода, весьма мало - за каждый год в отдельности. Однако нужно помнить, . что это справедливо лишь для рядов с с-показателем, существенно меньшим единицы. В нашем примере для ряда урожайности с-показатель равен 0,144, для себестоимости он равен 0,350. Коэффициент корреляции цепных абсолютных изменений составил 0,928, что очень близко к коэффициенту корреляции отклонений от трендов.
Для рядов с тенденцией, близкой к экспоненте, следует рекомендовать корреляцию цепных темпов роста. Вычисление корреляции рядов динамики по цепным показателям не требует предварительного вычисления трендов, но все же желательно иметь о характере тенденции приближенное представление. Для параболических трендов с не очень большими ускорениями можно коррелировать цепные абсолютные изменения; при больших ускорениях лучше их не коррелировать. Если коррелируемые ряды имеют разные типы тенденций, вполне допустимо коррелировать соответствующие разные цепные показатели: абсолютные изменения в одном ряду с темпами изменений в другом и т. д.
К сожалению, все вышеизложенные приемы по существу решают только задачу измерения связи между колебаниями признаков, а не между тенденциями их изменений. Насколько допустимо переносить выводы о тесноте связи между колебаниями на связь динамических рядов в целом, зависит от материального, качественного содержания процесса и причинного механизма связи. Это проблема, выходящая далеко за пределы статистической науки. Если колебания урожайности являются на самом деле следствиями колебания суммы осадков за лето, т. е. корреляция именно колебаний отвечает сущности причинной связи, то, например, причинную связь между дозой удобрений и урожайностью нельзя свести к зависимости только между колебаниями. Здесь главное - причинная связь тенденций, а ее измерять мы так и не научились.
Завершая этим признанием главу о статистическом анализе рядов динамики, дадим последние методологические советы изучающим статистику.
Всякая наука - это процесс продолжающегося познания природы и общества. Нет наук законченных, которые следует лишь выучить наизусть, чтобы все знать.
Учебники и учебные пособия - лишь сжатые и неполные изложения уже достигнутого наукой уровня познания. Изучайте специальную литературу, если хотите больше знать, а также новейшие достижения ученых всего мира.
Не считайте и себя только «сосудами для вливания» знаний. Познав известное, вы тоже можете (и должны!) внести свой вклад в дальнейшее развитие теории статистики. «Если не я - то кто же?»
Рекомендуемая литература к главе 9
1. Андерсон Т. Статистический анализ временных рядов / Пер. с англ. -М.: Мир. - 1976.
2. Афанасьев В. Н. Статистическое обеспечение проблемы устойчивости сельскохозяйственного производства. - М.: Финансы и статистика, 1996.
3. Ванну Я. Я.-Ф. Корреляция рядов динамики. - М.: Статистика, 1977.
4. КазинецЛ. С. Темпы роста и абсолютные приросты. - М.: Статистика, 1975.
5. Четыркин Е. М. Статистические методы прогнозирования. - Изд. 2-е, -М.: Статистика, 1977.
6. Юзбашев М. М„ Манелля А. И. Статистический анализ тенденций и колеблемости. - М.: Финансы и статистика, 1983.
Дата добавления: 2015-01-21; просмотров: 2166;