Снижение размерности представления данных методами факторного анализа
При коррелированности анализируемых показателей эффективным методом снижения размерности представления данных, в том числе и в графическом виде, является факторный анализ.
Так, при разработке комплексного регионального индекса для сравнительного анализа качества жизни в регионах Центральной России в качестве составляющих было принято четыре частных индекса уровня жизни, соответствующих четырем аспектам качества жизни в регионе (табл. 3.1): здоровьюнаселения, уровню интеллектуального потенциаларегиона, благосостоянию населения и уровню социальной напряженности в регионе.
В результате корреляционного анализа оказалось, что из четырех названных составляющих сильно коррелируют между собой только два индекса — здоровья и социальной напряженности, причем направленность взаимосвязи отрицательная (коэффициент корреляции Пирсона r=–0,732). Отрицательная корреляция средней силы наблюдается между индексом благосостояния и социальной напряженности (r=–0,469). Как тенденцию, можно отметить слабую положительную корреляцию между индексами здоровья и благосостояния, с одной стороны, и индексами интеллектуального потенциала и социальной напряженности, с другой (r=0,326 и 0,328 соответственно) — табл. 4.1.
Таблица 4.1
Корреляционная матрица частных индексов уровня жизни
Индекс благосостояния | Индекс здоровья | Индекс интеллектуального потенциала | Индекс социальной напряженности | ||
Индекс благосостояния | Коэф. кор. | 1,000 | 0,326 | 0,047 | -0,469 |
Уров. знач. | . | 0,202 | 0,857 | 0,058 | |
Индекс здоровья | Коэф. кор. | 0,326 | 1,000 | 0,134 | -0,732 |
Уров. знач. | 0,202 | . | 0,609 | 0,001 | |
Индекс интеллектуального потенциала | Коэф. кор. | 0,047 | 0,134 | 1,000 | 0,328 |
Уров. знач. | 0,857 | 0,609 | . | 0,199 | |
Индекс социальной напряженности | Коэф. кор. | -0,469 | -0,732 | 0,328 | 1,000 |
Уров. знач. | 0,058 | 0,001 | 0,199 | . |
В результате факторного анализа выявлено, что первые две главные компоненты объясняют 79,3 % общей дисперсии. Вращение факторов по методу «варимакс» улучшило факторную структуру (табл. 4.2).
Таблица 4.2
Матрица компонент факторного анализа частных индексов уровня жизни
До вращения | После вращения | |
1 | ||
Индекс благосостояния | 0,671 | 0,210 | 0,698 | 0,084 |
Индекс здоровья | 0,840 | 0,265 | 0,874 | 0,107 |
Индекс интеллектуального потенциала | -0,154 | 0,978 | 0,027 | 0,990 |
Индекс социальной напряженности | -0,933 | 0,228 | -0,876 | 0,395 |
По величинам факторных нагрузок в табл. 4.2 видно, что первый латентный фактор на положительном полюсе примерно в равной мере нагружен индексами благосостояния и здоровья, а на отрицательном полюсе — индексом социальной напряженности. Этот главный фактор может быть назван материальным фактором. Он объясняет около 50 % всей дисперсии. Второй латентный фактор отражает интеллектуальный потенциал населения региона; его «мощность» — 29 % (рис. 4.3). Соответственно, его можно интерпретировать как интеллектуальный фактор.
Рис. 4.3. Факторная структура частных индексов регионального показателя уровня жизни |
Два первых фактора суммарно объясняют 79 % дисперсии, поэтому их можно принять в качестве главных факторов, представить регионы в соответствующем двумерном пространстве и выполнить их визуальную кластеризацию (искажения структуры пространства признаков при этом составляют 21 %). Исходными данными служат факторные метки регионов, полученные с помощью соответствующей процедуры пакета SPSS Base 8.0 (рис. 4.4).
Рис. 4.4. Дифференциация регионов ЦФО по главным факторам регионального показателя уровня жизни |
Расположение регионов на плоскости главных факторов (рис. 3.5) позволяет выполнить их двумерную классификацию по «материальной» и «интеллектуальной» компонентам качества жизни.
Дата добавления: 2018-06-28; просмотров: 571;