Методи багатовимірної статистики: факторний і кластерний аналіз
Якщо аналіз даних передбачає використання великої кількості взаємопов'язаних ознак, доцільно застосувати спеціальні методи та алгоритми багатовимірної статистики. Ці методи потребують значних обчислень, для ефективного застосування яких необхідно мати обчислювальну техніку та спеціальне програмне забезпечення. Серед методів багатовимірної статистики найуживанішими є факторний та кластерний аналіз.
Суть факторного аналізу полягає в тому, що групу сильно скорельованих ознак можна пояснити та описати невеликою кількістю прихованих (латентних) факторів, які безпосередньо не спостерігаються, але розкривають значення ознак цієї групи. Наприклад, за такими ознаками, як «кількість прочитаних книг», «кількість книг у домашній бібліотеці», «кількість відвідувань театрів і музеїв», приховано фактор, який можна було б назвати «рівень культурного розвитку особистості». Факторний аналіз дає змогу виявити ці латентні фактори, описати залежність між ними та первинними ознаками, обчислити значення всіх побудованих таким чином факторів для кожного об'єкта. В результаті виникає можливість без значних втрат інформації перейти від аналізу великої кількості первинних ознак до аналізу порівняно невеликої кількості факторів.
Алгоритми кластерного аналізу дають змогу поділити сукупність об'єктів на однорідні за певним формальним критерієм подібності групи (кластери). Основною властивістю цих груп є те, що об'єкти, які належать одному кластеру, подібніші між собою, ніж об'єкти з різних кластерів. Таку класифікацію можна виконувати одночасно за досить великою кількістю ознак. Наприклад, відомо чимало статистичних показників, які характеризують рівень соціально-економічного розвитку адміністративних районів країни: кількість населення, кількість безробітних, протяжність шосейних доріг, кількість квадратних метрів житла на одну людину тощо. Для організації опитування необхідно згрупувати райони у більші утворення (регіони), але варто зробити це так, щоб у кожному такому регіоні були райони, близькі за своїм соціально-економічним розвитком. Це дасть змогу вибрати в такому регіоні один типовий район і результати опитування в ньому узагальнити щодо всього регіону. Таке групування може бути ефективно проведене методом кластерного аналізу, оскільки у даному разі враховується та узагальнюється велика кількість показників.
Підсумок аналізу та інтерпретації соціологічних даних набуває форми документів: звіту за результатами дослідження, інформаційної чи аналітичної довідки. Вони містять відомості, висновки та рекомендації для прийняття практичних (управлінських) рішень. У науково-дослідному плані — це банк соціологічних даних наукового аналізу.
Контрольні запитання:
1. У чому полягають особливості якісних та кількісних ознак?
2. Які показники використовують для оцінки зв’язку між двома ознаками?
3. За якою ознакою застосовують методи регресійного аналізу даних?
4. Охарактеризуйте клас задач, що розв’язуються методами факторного та кластерного аналізу?
Дата добавления: 2015-08-26; просмотров: 705;