Многомерное шкалирование
10.1 Метод многомерного шкалирования является своего рода альтернативой кластерному анализу. Исходным материалом для этих двух методов являются одна и та же матрица показателей сходства и различий: расстояний, коэффициентов корреляции или подобия. В кластерном анализе эти матрицы использовались для выделения групп наблюдений с относительно небольшими взаимными расстояниями. Цель многомерного шкалирования - в получении по этим матрицам такого наглядного графика, который в пространстве небольшого числа измерений (обычно 2 - 3) наглядно демонстрировал бы взаимное расположение изучаемых единиц в соответствии со значениями показателей их близости. Иными словами, целью многомерного шкалирования является построение такого графика, на котором визуально наблюдаемые расстояния между точками, представляющими единицы, были бы максимально сходными с реальными расстояниями, полученными по значениям признаков.
Таким образом, цели многомерного шкалирования можно формулировать так. Исходным материалом для него является матрица
0 D12 D13 ... D1k
D12 0 D23 ... D2k
D = D13 D23 0 ... D3k , (9.1)
... ... ... ... ...
D1k D2k D3k ... 0
включающая расстояния между k исследуемыми единицами. Необходимо построить график, опирающийся на небольшое количество (n) осей X1, X2, ..., Xn, на котором будут представлены точки, соответствующие этим единицам. Координаты точек для n осей Xi составляют прямоугольную матрицу
x11 x21 ... xn1
x12 x22 ... xn2
X = x13 x23 ... xn3 . (9.2)
... ... ... ...
x1k x2k ... xnk
Эта матрица называется конфигурацией многомерного шкалирования. По этим координатам можно вычислить расстояния между любой j-й и l-й точками на графике в виде метрики Евклида
n
vij2 = S (xij - xil)2 .
i = 1
Расстояния vij можно увидеть непосредственно на графике, поэтому мы их будем в дальнейшем называть визуальными в отличие от эмпирических значений Dij. Все эти вычисленные по графику визуальные расстояния между всеми точками составят матрицу
0 v12 v13 ... v1k
v12 0 v23 ... v2k
V = v13 v23 0 ... v3k , (9.3)
... ... ... ... ...
v1k v2k v3k ... 0
- 254 -
Очевидно, задача многомерного шкалирования сводится к нахождению на основе матрицы эмпирических расстояний D такой конфигурации X, чтобы найденная матрица визуальных расстояний Vнаилучшим образом соответствовала бы D. Это соответствие можно понимать двояко. Во-первых, можно требовать, чтобы между элементами матриц D и V существовала бы пропорциональность вида Dij = c vij, где c - некоторая константа. Если соответствие двух матриц расстояния задано в столь жестком виде, многомерное шкалирование называется метрическим. Существует иной, более мягкий и гибкий принцип соответствия матриц D и V, по которому между Dij и vij должны сохраняться соотношения упорядоченности, когда выполнение, например, неравенства Dij < Dlt < Dpq влечет за сбой соблюдение аналогичной упорядоченности vij < vlt < vpq. Такое шкалирование называется неметрическим.
Многомерному шкалированию могут подвергаться также корреляционные матрицы, описывающие связи между признаками или между индивидами. В этом случае между коэффициентами корреляции rij и визуальными расстояниями между точками на графике должны соблюдаться обратные соотношения. При этом точки графика должны быть тем ближе, чем выше коэффициент корреляции между признаками или индивидами.
Дата добавления: 2016-02-13; просмотров: 805;