Выявление структуры многомерных данных методами кластерного анализа

 

Результаты визуальной кластеризации по данным факторного анализа, при всей наглядности представления изучаемой выборки на плоскости, характеризуются большими или меньшими искажениями. Более точную, хотя и менее наглядную картину сходства и различия статистических единиц обеспечивает кластерный анализ по совокупности показателей. Продемонстрируем возможности данного метода на примере иерархического кластерного анализа регионов ЦФО по комплексу частных индексов уровня жизни, рассмотренных нами в предыдущем подразделе.

На рис. 4.5 представлена дендрограмма кластеризации регионов ЦФО по методу Уорда с квадратичной метрикой, полученная в результате реализации соответствующей процедуры ПСП SPSS Base 8.0.

 

  * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * *     Dendrogram using Ward Method   Rescaled Distance Cluster Combine   C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+   Калужская 6 -+ Рязанская 13 -+-+ Курская 8 -+ +-------+ Брянская 2 -+-+ I Тамбовская 15 -+ I I Владимирская 3 -+-+ +-----+ Костромская 7 -+ I I Смоленская 14 -+ I +-------------------------------+ Тверская 16 -+---------+ I I Тульская 17 -+ I I Ивановская 5 -----------------+ I Белгородская 1 ---+---+ I Воронежская 4 ---+ +-------+ I Орловская 12 -------+ +---------------------------------+ Липецкая 9 ---+-------+ I Московская 11 ---+ +---+ Ярославская 18 -----------+  
Рис. 4.5. Дендрограмма регионов ЦФО по частным индексам регионального показателя уровня жизни

 

 

На уровне 60 %-ного сходства внутри кластеров по дендрограмме можно выделить две группы регионов. В первый кластер входят шесть областей: Белгородская, Воронежская, Орловская, Липецкая, Московская и Ярославская, во второй кластер — остальные 11: Калужская, Рязанская, Курская, Брянская, Тамбовская, Владимирская, Костромская, Смоленская, Тверская, Тульская и Ивановская области. На уровне сходства 75 % в первом кластере дополнительно можно выделить два подкластера, в первый из которых входят Белгородская, Воронежская и Орловская области, во второй — Липецкая, Московская и Ярославская. Из второго кластера как самостоятельный подкластер выделяется Ивановская область.

Исходя из поставленной в исследовании задачи дифференциации областей ЦФО на группы по уровню жизни, принята классификация регионов на два класса. В первый класс входят шесть относительно благополучных регионов, во второй 11 менее благополучных регионов.

а б
в г
Рис. 4.6. Распределение индексов по кластерам регионов ЦФО: а — благосостояния; б — здоровья; в — интеллектуального потенциала; г — социальной напряженности

 

Такая идентификация классов подтверждается диаграммой распределения частных индексов (рис. 4.6), причем наибольшее различие между кластерами наблюдается по индексам здоровья и благосостояния.








Дата добавления: 2018-06-28; просмотров: 322;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.004 сек.