Факторный и кластерный анализ
Кластерный и факторный анализы преследуют ту же цель, что и рассмотренные в предыдущем разделе методы логистической регрессии и дискриминантного анализа: классифицировать переменные и/или категории респондентов по однородным группам (сегментам, кластерам). Однако между этими методами существует одно серьезное различие. При дискриминантном анализе и логистической регрессии у нас заранее есть некая зависимая (результирующая) переменная с двумя или более вариантами ответа (уровнями, категориями). Задача анализа в данном случае состоит в классификации имеющихся категорий респондентов (возрастных, половых и других) по этим уровням результирующей переменной. Эти два статистических метода позволяют сегментировать выборку на заранее известные целевые группы. При кластерном и факторном анализе ситуация иная: кластеры (сегменты, категории), на которые следует разделить выборку, заранее не известны. Задачей статистического анализа в данном случае будет не только формирование максимально однородных сегментов, но и выделение кластеров, по которым будет производиться сегментирование. Приведем пример релевантного задания для факторного (кластерного) анализа.
Исходные данные:
Респондентам (пассажирам международных рейсов авиакомпании X) в ходе опроса предлагалось 24 утверждения, по которыми они должны были выразить степень своего согласия либо несогласия по десятибалльной шкале — от 1 (совершенно не согласен) до 10 (абсолютно согласен). Предложенные утверждения описывают текущую конкурентную позицию рассматриваемой компании на международном рынке авиаперевозок. В результате опроса и последующих подготовительных этапов к статистическому анализу (см. раздел 3) был получен массив из 24 одновариантных переменных (ql-q24) с кодами ответов соответственно от 1 до 10 (интервальная шкала).
ql. Авиакомпания X обладает репутацией компании, превосходно обслуживающей пассажиров.
q2. Авиакомпания X может конкурировать с лучшими авиакомпаниями мира.
q3. Я верю, что у авиакомпании X есть перспективное будущее в мировой авиации.
q4. Я знаю, какой будет стратегия развития авиакомпании X в будущем.
q5. Я горжусь тем, что работаю в авиакомпании X.
q6. Внутри авиакомпании X хорошее взаимодействие между подразделениями.
q7. Каждый сотрудник авиакомпании прикладывает все усилия для того, чтобы обеспечить ее успех.
q8. Сейчас авиакомпания X быстро улучшается.
q9. Нам предстоит долгий путь, прежде чем мы сможем претендовать на то, чтобы
называться авиакомпанией мирового класса.
qlO. Авиакомпания X действительно заботится о пассажирах.
qll. Среди сотрудников авиакомпании имеет место высокая степень удовлетворенности работой.
ql2. Я верю, что менеджеры высшего звена прикладывают все усилия для достижения успеха авиакомпании.
ql3. Мне нравится, как в настоящее время авиакомпания X представлена визуально широкой общественности (в плане цветовой гаммы и фирменного стиля).
ql4. Авиакомпания X — лицо России.
ql5. Мы выглядим «вчерашним днем» по сравнению с другими авиакомпаниями.
ql6. Обслуживание авиакомпании Х является последовательным и узнаваемым во всем мире.
ql7. Я бы не хотел, чтобы авиакомпания X менялась.
ql8. Авиакомпании X необходимо меняться для того, чтобы использовать в полной мере имеющийся потенциал.
ql9. Я думаю, что авиакомпании X необходимо представить себя в визуальном плане более современно.
q20. Изменения в авиакомпании X будут позитивным моментом. q21. Авиакомпания X — эффективная авиакомпания.
q22. Я бы хотел, чтобы имидж авиакомпании X улучшился с точки зрения иностранных пассажиров.
q23. Авиакомпания X — лучше, чем многие о ней думают.
q24. Важно, чтобы люди во всем мире знали, что мы — российская авиакомпания. Требуется:
Выявить схожие (то есть тесно коррелирующие между собой) утверждения и разделить их на несколько однородных групп, описывающих различные аспекты (макропараметры)
конкурентной позиции авиакомпании X на рынке. Другими словами, выделить группы схожих по значению параметров авиакомпании, характеризующих ее состояние на рынке с различных сторон.
Данную задачу невозможно решить методами логистической регрессии или дискриминантного анализа, так как у нас нет зависимой (результирующей) переменной: есть только массив, на первый взгляд, независимых равнозначных параметров. Поставленную цель можно достичь при помощи либо факторного анализа, либо кластерного. Однако прежде, чем мы приступим к решению, следует сказать несколько слов об основных характерных чертах и различиях между этими двумя статистическими методами, предназначенными для решения схожих задач.
Факторный анализ позволяет разделить массив переменных на малое число групп, которые называются факторами. Классификация производится на основании критерия корреляции между переменными. В один фактор объединяются несколько переменных, тесно коррелирующих между собой и не коррелирующих или слабо коррелирующих с другими переменными, составляющими другие факторы. Таким образом, в результате факторного анализа мы получаем из несистематизированного массива данных несколько макропеременных, описывающих различные характеристики продукта компании (или другого исследуемого объекта). Основная сложность при проведении факторного анализа заключается в необходимости рационально интерпретировать полученные макрокатегории с точки зрения здравого смысла (применительно к целям и специфике конкретного исследования). Данная проблема не имеет универсального решения и подлежит отдельному анализу в каждом конкретном случае. Ниже мы продемонстрируем пример интерпретации результатов факторного анализа. Именно сложность интерпретации результатов является существенным ограничением рассматриваемой статистической методики, так как из-за невозможности логического описания полученных категорий иногда приходится вообще отказаться от ее использования.
Еще одним ограничением применения факторного анализа является ситуация, когда одна и та же переменная относится сразу к двум или более факторам, то есть переменную нельзя однозначно классифицировать. В таком случае следует либо отказаться от использования факторного анализа и попытаться применить другие статистические методики (например, кластерный анализ), либо заново пересчитать факторную модель без данной переменной, а затем вручную отнести неоднозначную переменную к тому или иному фактору на основании логических соображений.
Далее приведены основные примеры использования факторного анализа в маркетинговых исследованиях.
Сегментирование рынка. Факторный анализ применяется для выявления агрегатных переменных, являющихся основанием для сегментирования потребителей. Например, потребители плавленых сыров могут характеризоваться различной степенью значимости, которую они видят в исследуемых характеристиках данного продукта (респондентов просят оценить по пятибалльной шкале важность нескольких характеристик плавленых сыров: срок хранения, калорийность, процент жирности и т. д.). Здесь факторный анализ позволит выявить целевые сегменты потребителей на основании значимости для них различных групп факторов:
■ покупатели, ориентирующиеся при выборе плавленого сыра преимущественно на ценовые факторы (стоимость, скидки);
■ покупатели, ориентирующиеся на качество исследуемого продукта (срок хранения, состав ингредиентов, вкус);
■ покупатели, выбирающие сыр в основном по внешнему виду (дизайн упаковки).
В целом следует отметить, что в настоящее время все большую популярность среди исследователей приобретают методы сегментирования потребителей на основании их психографических характеристик. Для этого в анкету включается достаточно большое количество высказываний (порядка 100-150), характеризующих различные стороны жизненного стиля респондентов. Респонденты должны выразить свое согласие или несогласие с данными высказываниями по шкале Лайкерта (согласен — скорее согласен — ни то ни другое — скорее не согласен — не согласен). В дальнейшем на основании ответов респондентов формируются однородные целевые сегменты (обычно порядка 10).
Изучение продукта и бенчмаркинг продукта. В данном случае факторный анализ помогает выявить агрегатные параметры продукта, влияющие на выбор потребителя. Например, различные марки шоколадных конфет могут быть оценены по следующим макрокатегориям: качество (ингредиенты, вкус), полезность для здоровья (наличие сахара, калорийность) и цена.
Рекламные и медиа-исследования. Факторный анализ может использоваться для выявления скрытых мотивов поведения потребителей при восприятии рекламы.
Ценообразование. Факторный анализ используется для выявления особенностей поведения потребителей, чувствительных к цене. Например, данная категория респондентов может характеризоваться повышенным вниманием к ценовым факторам при выборе продукта, низкими доходами, большой численностью семьи и т. д.
Кластерный анализ является аналогом факторного анализа в том-смысле, что он так же, как и факторный анализ, позволяет выделить факторы (кластеры), объединяющие статистически схожие переменные. Однако в данном случае переменные классифицируются не на основании степени тесноты корреляционной связи, а на основании более сложных статистических процедур (наиболее часто используется метод исследования расстояний между переменными в кластерах). Ниже мы продемонстрируем действие обеих анализируемых статистических методик на одном массиве данных (см. выше).
Несмотря на имеющуюся возможность классифицировать переменные кластерный анализ чаще всего применяется для кластеризации групп респондентов (то есть уровней или категорий переменных)1. Данная возможность позволяет, например,
провести пробное (при неизвестных целевых группах) сегментирование целевых покупателей какого-либо продукта. Сформированные в результате кластерного анализа целевые группы респондентов обладают схожим поведением (то есть взаимозависимостями) своих характеристик. В качестве примера успешной кластеризации можно привести разбиение респондентов на две группы:
■ женщины в возрасте старше 45 лет;
■ все мужчины и женщины младше 45 лет.
При использовании рассматриваемой статистической методики для кластеризации респондентов можно совмещать кластерный и факторный анализ, причем в данном случае факторный анализ будет предшествовать кластерному. Часто это делается для того, чтобы сократить количество переменных, участвующих в кластерном анализе (при большом числе этих переменных). Так, можно сначала выделить среди большого числа переменных макропараметры, а затем сегментировать респондентов уже на основании данных факторов.
Теперь у вас сложилось общее представление о методах факторного и кластерного анализа, и мы можем приступить к описанию их практического применения. Воспользуемся условием задачи про анализ текущей конкурентной позиции авиакомпании X. Эта задача поможет нам также сравнить действие данных статистических методик на одной и той же выборке. Для описания кластерного анализа, применяемого для кластеризации респондентов, мы будем использовать другой пример из практики маркетинговых исследований. Так как для классификации переменных факторный анализ все же применяется чаще, чем кластерный (это сложилось исторически и, кроме того, оправдано меньшими усилиями, затрачиваемыми на проведение факторного анализа), в разделе 5.2.2 основное внимание будет уделено описанию действия кластерного анализа для классификации респондентов (выделения целевых групп потребителей). Сравнение действия двух статистических методов при классификации переменных мы предложим уже в заключении раздела 5.2.2.
В качестве примеров практического применения кластерного анализа в маркетинговых исследованиях можно указать все те же случаи, что и при факторном анализе (если кластерный анализ используется для классификации переменных). В случае применения кластерного анализа для классификации конкретных групп респондентов он предоставляет исследователю гораздо более гибкие возможности и в большем числе областей маркетинговых исследований по сравнению с факторным анализом. Это преимущество кластерного анализа обусловлено тем, что он анализирует не переменные в целом, а конкретные категории респондентов (например, различные половозрастные, доходные и другие группы покупателей). Таким образом, можно сделать важный вывод относительно факторного и кластерного анализов. Целью факторного анализа является сокращение числа переменных, участвующих в анализе (выделение релевантных макрокатегорий переменных), а целью кластерного — классификация респондентов на целевые группы на основании их существенных характеристик.
Из всего сказанного становится понятно, почему оба типа статистического анализа иногда используются в паре: факторный анализ определяет состав макропеременных (например, для сегментирования потребителей), а кластерный на основании выделенных существенных характеристик респондентов производит формирование целевых сегментов. Применение факторного и кластерного анализов в паре оправдано в основном в тех случаях, когда изначально респонденты оцениваются по большому числу параметров и проведение кластерного анализа непосредственно над данным (большим) набором переменных представляется затруднительным или даже практически невозможным. Отметим, что для проведения факторного и кластерного анализов в паре следует сначала провести факторный анализ, сохранив полученные факторные рейтинги, а затем проводить кластерный анализ на основании полученных групп переменных. Более подробно парное использование факторного и кластерного анализов будет показано в разделе 5.2.2.
В табл. 5.3 представлены основные характеристики переменных, участвующих в факторном и кластерном анализах.
Таблица 5.3. Основные характеристики переменных, участвующих в факторном и кластерном анализах
Факторный анализ | |||
Зависимые переменные | Независимые переменные | ||
Количество | Тип | Количество | Тип |
Нет | - | Любое | Любой |
Кластерный анализ | |||
Зависимые переменные | Независимые переменные | ||
Количество | Тип | Количество | Тип |
Нет | - | Любое | Любой |
Дата добавления: 2015-04-25; просмотров: 4459;