Методика кластерного аналізу
Дослідники часто постають перед величезною масою індивідуальних спостережень. Виникає задача зведення великої кількості характеристик до невеликого ряду узагальнюючих підсумків, що відображають дійсно суттєве для цього явища. Але поки ознака, яка залучена в аналіз, залишається окремим самостійним елементом зі своїми характеристиками, число параметрів, що відображають результати обробки, не піддаються зменшенню. Єдиним шляхом до нього – є або відсікання більшості ознак і повернення до мало розмірних класичних задач, або до об’єднання ознак, в заміні цілих кетяг їх одним, штучно побудованим на їх основі. Так появився напрямок – багатомірний аналіз.
В багатомірному статистичному аналізі створились розділи, котрі не ізольовані, а проникають, переходять один в одного. Це кластерний аналіз, метод головних компонент, факторний аналіз. Найбільш яскраво відображають риси багатомірного аналізу у класифікації об’єктів – кластерний аналіз, а в дослідженні зв’язків – факторний аналіз.
Кластерний аналіз – це спосіб групування багатомірних об’єктів , заснований на представленні результатів окремих спостережень точками відповідного геометричного простору з наступним виділенням груп як «згустків» цих точок (кластерів, таксонів). «Кластер» у англійській мові означає згусток, кетяг винограду, «скупчення зірок» і т.д. Даний метод дослідження отримав розвиток в останні роки у зв’язку з можливостями комп’ютерної обробки великих баз даних.
Кластерний аналіз передбачає виділення компактних, віддалених один від одного груп об’єктів, відшукує «природну» розбивку сукупності на області скупчення об’єктів. Він використовується, коли вихідні дані представлені у вигляді матриць близькості або відстані між об’єктами або у вигляді точок у багатомірному просторі. Найбільш розповсюджені дані другого виду, для яких кластер ний аналіз орієнтований на виділення деяких геометрично віддалених груп, всередині якої об’єкти близькі.
Видбір відстані між об’єктами є вузловим моментом дослідження, від нього в більшості залежить остаточний варіант розбиття об’єктів на класи при заданому алгоритмі розбиття.
Існує велика кількість алгоритмів кластерного аналізу, їх можна розділити за способом побудови кластерів на 2 типи: еталонні і не еталонні. В процедурах еталонного типу на більшості об’єктів задається кілька вихідних зон, з якими починає працювати алгоритм. Еталони можуть представляти собою первісне розбиття на класи, центр тяжіння класу і ін.. Після завдання еталонів алгоритм здійснює класифікацію, іноді змінюючи певним способом еталони.
До алгоритмів кластеризації, що працюють за іншими принципами, відносяться ієрархічні алгоритми кластерного аналізу.
Розв’язання задач кластерного аналізу є розбиття, що задовольняє деякій умові оптимальності. Цей критерій може представляти собою деякий функціонал, що відображає рівні бажаності різного розбиття і групувань. Цей функціонал часто називають цільовою функцією. Завданням кластерного аналізу є задача оптимізації, тобто знаходження мінімуму цільової функції при деякому заданому наборі обмежень. Прикладом цільової функції можуть слугувати, зокрема, сума квадратів внутрігрупових відхилень за всіма кластерами.
Велика перевага кластерного аналізу в тому, що він дозволяє здійснювати розбиття об’єктів не за одним параметром, а за цілим набором ознак. Крім того, кластер ний аналіз у відмінність від більшості економіко-математичних методів, не накладає ніяких обмежень на вид об’єктів, що розглядаються, і дозволяє розглядати більшість вихідних даних практично довільної природи. Це має велике значення для прогнозування кон’юнктури, коли показники мають різноманітний вигляд, що утруднює застосування традиційного групування.
Кластер ний аналіз застосовується в маркетингу – це сегментація конкурентів і споживачів. В менеджменті –розбивка персоналу на різні за мотивацією групи,
класифікація постачальників, виявлення схожих виробничих ситуацій, при яких виникає брак.
Перевагою кластерного аналізу є ще й те, що він працює навіть тоді, коли даних недостатньо і не виконуються вимоги нормальності розподілу випадкових величин та інші вимоги класичних методів статистичного аналізу.
Пояснімо це на простому прикладі. Проведено анкетування співробітників для того, щоб визначити яким чином можна найбільш ефективно керувати персоналом, тобто необхідно розподілити співробітників на групи і для кожної з них виділити найбільш ефективні важелі керування, при чому відмінності між групами повинні бути очевидними, а в середині груп респондентів повинні бути максимально схожими.
Ось тут і можна скористатися кластер ним аналізом. Спочатку будується дерево цілей, дивлячись на яке визначається на скільки кластерів можна розбити персонал. Припустимо, що персонал можна розбити на три групи. Тоді для вивчення респондентів, попавши в кожний кластер, складається наступна таблиця:
у%%
Кластер | чоловік | 30-50 р. | ›50 | Керівн. посади | Медичне Страх. | Пільги | Зароб. плата | Стаж | Освіта |
Пояснімо, як сформована вищенаведена таблиця.
У першому стовбці розташований номер кластеру –групи, дані за якої відображені в рядку.
Наприклад, Перший кластер: 80% складають чоловіки, 90 % з яких попадають у вікову категорію 30-50 років, а 12% з них рахують, що пільги дуже важливі і т.д.
Попробуємо скласти портрет респондентів кожного кластера
Перший кластер – в основному чоловіки зрілого віку займають керівні позиції. Соціальний пакет їх мало цікавить. Вони більш бажають отримувати високу заробітну плату, а не допомогу від працедавця.
Другий кластер навпаки: віддає перевагу соціальному пакету. Складається вона в основному з людей похилого віку, які займають невисокі посади. Заробітна плата, безумовно, також важлива, але й інші пріоритети.
Третій кластер найбільш молодий. У відмінність від перших двох очевидними є інтерес до можливості навчання і професійного росту. У цій категорії співробітників є непоганий шанс найблищим часом попасти в першу групу.
Таким чином, плануючи кампанію для впровадження ефективних методів управління персоналом, очевидно, що в нашій ситуації. можна збільшити соціальний пакет, у другій – на шкоду, наприклад, заробітній платі. Якщо говорити про те. Яких спеціалістів слід направляти на навчання. То можна однозначно рекомендувати звернути увагу на третю групу.
Дата добавления: 2015-08-26; просмотров: 1541;