Выявление структуры многомерных данных методами кластерного анализа
Результаты визуальной кластеризации по данным факторного анализа, при всей наглядности представления изучаемой выборки на плоскости, характеризуются большими или меньшими искажениями. Более точную, хотя и менее наглядную картину сходства и различия статистических единиц обеспечивает кластерный анализ по совокупности показателей. Продемонстрируем возможности данного метода на примере иерархического кластерного анализа регионов ЦФО по комплексу частных индексов уровня жизни, рассмотренных нами в предыдущем подразделе.
На рис. 4.5 представлена дендрограмма кластеризации регионов ЦФО по методу Уорда с квадратичной метрикой, полученная в результате реализации соответствующей процедуры ПСП SPSS Base 8.0.
* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ Калужская 6 -+ Рязанская 13 -+-+ Курская 8 -+ +-------+ Брянская 2 -+-+ I Тамбовская 15 -+ I I Владимирская 3 -+-+ +-----+ Костромская 7 -+ I I Смоленская 14 -+ I +-------------------------------+ Тверская 16 -+---------+ I I Тульская 17 -+ I I Ивановская 5 -----------------+ I Белгородская 1 ---+---+ I Воронежская 4 ---+ +-------+ I Орловская 12 -------+ +---------------------------------+ Липецкая 9 ---+-------+ I Московская 11 ---+ +---+ Ярославская 18 -----------+ |
Рис. 4.5. Дендрограмма регионов ЦФО по частным индексам регионального показателя уровня жизни |
На уровне 60 %-ного сходства внутри кластеров по дендрограмме можно выделить две группы регионов. В первый кластер входят шесть областей: Белгородская, Воронежская, Орловская, Липецкая, Московская и Ярославская, во второй кластер — остальные 11: Калужская, Рязанская, Курская, Брянская, Тамбовская, Владимирская, Костромская, Смоленская, Тверская, Тульская и Ивановская области. На уровне сходства 75 % в первом кластере дополнительно можно выделить два подкластера, в первый из которых входят Белгородская, Воронежская и Орловская области, во второй — Липецкая, Московская и Ярославская. Из второго кластера как самостоятельный подкластер выделяется Ивановская область.
Исходя из поставленной в исследовании задачи дифференциации областей ЦФО на группы по уровню жизни, принята классификация регионов на два класса. В первый класс входят шесть относительно благополучных регионов, во второй 11 менее благополучных регионов.
а | б |
в | г |
Рис. 4.6. Распределение индексов по кластерам регионов ЦФО: а — благосостояния; б — здоровья; в — интеллектуального потенциала; г — социальной напряженности |
Такая идентификация классов подтверждается диаграммой распределения частных индексов (рис. 4.6), причем наибольшее различие между кластерами наблюдается по индексам здоровья и благосостояния.
Дата добавления: 2018-06-28; просмотров: 391;