Представление данных в одном, двух и трех измерениях
К этой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент Data Mining включает способы визуального представления из этой группы.
В соответствии с количеством измерений представления это могут быть следующие способы:
· одномерное (univariate) измерение, или 1-D;
· двумерное (bivariate) измерение, или 2-D;
· трехмерное или проекционное (projection) измерение, или 3-D.
Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.
При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных:
· его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания);
· топологические особенности;
· наличие трендов;
· информацию о взаимном расположении данных;
· существование других зависимостей, присущих исследуемому набору данных.
Если набор данных имеет более трех измерений, то возможны такие варианты:
· использование многомерных методов представления информации (они рассмотрены ниже);
· снижение размерности до одно-, двух- или трехмерного представления.
Существуют различные способы снижения размерности, один из них - факторный анализ - был рассмотрен в одной из предыдущих лекций. Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена.
Представление данных в 4 + измерениях
Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.
Наиболее известные способы многомерного представления информации:
· параллельные координаты;
· "лица Чернова";
· лепестковые диаграммы.
Дата добавления: 2015-09-28; просмотров: 1135;