ИЗМЕНЧИВОСТИ НАБОРА ПРИЗНАКОВ. Определим межгрупповую изменчивость как вариабельность показателей цент-ральной тенденции (средних арифметических величин
МНОГОМЕРНЫЕ МЕТОДЫ ИЗУЧЕНИЯ МЕЖГРУППОВОЙ
Определим межгрупповую изменчивость как вариабельность показателей цент-ральной тенденции (средних арифметических величин, долей встречаемости качест-венных признаков), определенных в нескольких однородных группах наблюдений для некоторого набора признаков. Однородность здесь понимается как отсутствие внутрен-ней структуры в наблюдениях, принадлежащих к отдельной их группе. Однородность должна наблюдаться по таким факторам как возраст, пол, профессиональная или этно-территорильная принадлежность и т.п.
В зависимости от причин, вызывающих межгрупповую изменчивость, в антрополо-гии можно выделить несколько ее вариантов: возрастную, половую, профессиональ-ную, расовую, этно-территориальную, таксономическую и т.д. При изучении межгруппо-вой изменчивости исследователю приходится сталкиваться с более сложной ситуацией вариации признаков по сравнению с изменчивостью внутригрупповой. В этом последнем случае в эмпирических данных присутствовал только один компонент вариации - инди-видуальная изменчивость около некоторой центральной точки. В межгрупповой ситу-ации вариация имеет по меньшей мере два уровня. Первый из них составляет внутри-групповая межиндивидуальная изменчивость, второй - межвыборочная (межгрупповая) изменчивость.
Обычно при изучении межгрупповой вариации возникает одна из двух задач: дискри-минации и классификации. Первая из них предполагает существование нескольких гене-ральных совокупностей, и из каждой - извлечена выборка. По этим выборкам можно по-лучить представление о центральных точках их многомерных распределений, законо-мерностях соотносительной изменчивости признаков. Такие выборки называются обуча-ющими. Задача дискриминации состоит в том, что одно или несколько наблюдений следует обоснованно отнести к одной из нескольких генеральных совокупностей в соот-ветствии с информацией о них, содержащейся в обучающих выборках. Эта задача реша-ется в рамках дискриминантного или канонического дискриминантного анализов.
Задача классификации заключается в том, что имеется несколько групп наблюдений, которые обычно являются выборками из каких-то генеральных совокупностей, хотя могут являться и отдельными наблюдениями. В соотношении этих группа друг с другом может присутствовать некоторая естественная структура, которая неизвестна, но которую не-обходимо выявить. В результате можно попытаться получить несколько объединений, каждое из которых должно включать какое-то количество групп наблюдений (или отдель-ных наблюдений), особенно сходных друг с другом по анализируемым признакам. При этом ни количество таких групп, ни их состав обычно заведомо неизвестны.
По существу здесь идет речь о получении классификации рассматриваемых объектов (выборок или отдельных наблюдений). Иногда эта задача называется классификаций без обучающих выборок. Она может быть решена с привлечением кластерного анализа, кано-нического дискриминантного анализа, многомерного шкалирования. В частности кано-нический дискриминантный анализ может быть направлен на выявление основных
- 165 -
направлений межгрупповой изменчивости, примерно так же как аналогичная задача решалась в рамках компонентного анализа для вариации внутригрупповой.
При решении обеих задач: дискриминации и классификации часто бывает необходимо решить третью проблему – визуализацию данных. Многомерный характер рассматривае-мых материалов делает затруднительным наглядное представление получаемых резуль-татов за исключением тех простейших случаев, когда число признаков равно 2 - 3. Вместе с тем, наглядный визуальный анализ структуры изучаемой межгрупповой вари-ации может сам по себе способствовать решению поставленных задач. Свойствами ви-зуализации данных обладают канонический дискриминантный анализ и многомерное шкалирование. Последний метод специально приурочен к решению этой проблемы.
Дата добавления: 2016-02-13; просмотров: 581;