Собственные значения главных компонент для трех
каналов Landsat -7 (1999.10)
STATISTICA ФАКТОРНЫЙ АНАЛИЗ | Собственные значения Выделение: Главные компоненты | ||||
Значение | Собственные значения | % общей дисперсии | Кумулят. соб. знач. | Кумулят. % | |
1 2 3 | 2,555880 0,311887 0,132234 | 85,19599 10,396224 0,40779 | 2,555880 2,867766 3,000000 | 85,1960 95,5922 100,0000 | |
Если распределения нормальны, то энтропия для непрерывного распределения равна:
Hi = 0,5log2 (2pesi),
где si – дисперсия i-фактора.
Таким образом, при допущении нормальности распределения значений факторов общая энтропия изображения в силу независимости факторов равна сумме их энтропий:
H = H1+H2+H3 = 0,5(3log2 (2pe)+log2s1+ log2s2+ log2s3).
Таблица 3
Факторные нагрузки – коэффициенты корреляции переменных с факторами для трех каналов Landsat – 7 (1999.10).
Фактор 1 | Фактор 2 | Фактор 3 | |
R (красный) | 0,952035 | -0,119955 | -0,281496 |
G (зеленый) | 0,925829 | -0,308871 | 0,217804 |
B (голубой) | 0,890140 | 0,449551 | 0,074533 |
Дисперсия | 2,555880 | 0,311887 | 0,132234 |
Дисперсия %% | 85,1960 | 10,3962 | 4,4078 |
Из табл. 3 следует, что 85% всего разнообразия описывается первым фактором, и с этим фактором в наибольшей степени положительно коррелируют все каналы. Второй фактор в наибольшей степени отражает собственную информацию, содержащуюся в голубом канале, и с отрицательной корреляцией – существенную часть варьирования яркости в зеленом канале. Третий фактор в какой-то степени отображает независимую информацию, содержащуюся в красном и зеленом каналах.
На рис. 7 представлено разложение трех каналов по ортогональному базису трех факторов. Эти изображения полностью независимы друг от друга. Первый фактор отображает почти всю информацию, содержащуюся в трех каналах, и читается как обычная панхроматическая фотография. Второй фактор с высокой надежностью выделяет, по крайней мере, крупные населенные пункты, как совершенно особые территории. Это определяется высоким уровнем их «голубизны», по-видимому, в результате загрязнения атмосферы при малой яркости в зеленой части спектра. Третий фактор, как наиболее яркий, выделяет наиболее «зеленые» и вместе с тем наименее «красные» территории, а как темные – наоборот. Можно полагать, что темному цвету соответствуют ландшафты с высокой яркостью в красном канале, то есть наиболее «сухие» и наиболее «теплые» почвы, а светлому, напротив, – относительно влажные. Скорее всего, темному тону соответствуют песчаные флювиогляциальные отложения, а светлому, напротив, – богатые суглинистые почвы.
Построив распределения по каждому фактору для 256 градаций, можно определить содержащуюся в них энтропию по дискретной схеме: Hi = – Spjlog2pj ,
где pj – вероятность (частота) яркости, j = 0,1,2…255.
Общая энтропия в этом случае оценивается как:
H = H1+H2+H3 +(log2s1+log2s2+logs3) -3log3,
где аргументы с дисперсией корректируют вклад каждого фактора в общее разнообразие.
На рис. 6 приведены распределения в красном канале для осеннего и зимнего снимков. Характер распределений показывает, что качество осеннего изображения низкое и распределение, в отличие от зимнего снимка, не непрерывное. В табл. 4 приведена матрица корреляции, а в табл. 5 – факторные нагрузки и дисперсии для зимнего снимка.
Таблица 4
Корреляционная матрица между каналами (Landsat – 7, 1999.01)
R | G | B | |
R | 1,00 | 0,85 | 0,48 |
G | 0,85 | 1,00 | 0,99 |
B | 0,84 | 0,99 | 1,00 |
Из табл. 4 следует, что величин корреляции значений яркостей в разных каналах зимой существенно выше, чем осенью (табл.1). Соответственно, общее разнообразие изображения зимой должно быть меньше, чем осенью.
Таблица 5
Факторные нагрузки – коэффициенты корреляции переменных с факторами для трех каналов Landsat- 7 (1999.01)
Фактор 1 | Фактор 2 | Фактор 3 | |
R (красный) | 0,929656 | -0,368418 | 0,002786 |
G (зеленый) | 0,983391 | 0,164804 | -0,076035 |
B (голубой) | 0,980147 | 0,184090 | 0,073644 |
Дисперсия | 2,792006 | 0,196781 | 0,011213 |
Дисперсия %% | 0,930669 | 0,065594 | 0,003738 |
На рис. 8 показано факторное разложение по ортогональному базису зимнего сканерного снимка. В табл. 6 приведены оценки разнообразия для каналов, факторов и две оценки общего разнообразия. Информации в каналах осеннего снимка меньше, чем в каналах зимнего, что прямо определяется качеством изображения. Исправить эти искаженные оценки можно через показатель выравненности.
E = H/log(m),
где m – число реально существующих значений яркости.
Показатель выравненности фактически определяет соотношение измеренной информации к максимально возможной. Максимально возможная информация соответствует гипотетическому случаю равновероятностного распределения всех 256 яркостей (m).
Следовательно:
Hmax = – S(1/m )log (1/m) = log(m).
В таблице приведены соответствующие значения, которые показывают, что при всех условиях каждый канал зимой содержит большее разнообразие информации, чем те же каналы осенью. Введем скорректированные значения общего разнообразия, умножив значения выравненности на log(256), и рассчитаем новые оценки общего разнообразия через его скорректированные оценки. В результате получаем практически те же значения общего разнообразия изображения, что и по значениям дисперсий из разложения факторного анализа. Таким образом, оценки общего разнообразия по дисперсиям в разложении методом главных компонент можно считать достаточно надежными.
Оценим полученный результат. Нет сомнений в том, что рассмотренный метод дает вполне корректную оценку количества информации, или разнообразия, содержавшегося в изображении. Вполне очевидно, что, впрочем, видно и на глаз, что разнообразие осеннего изображения больше, чем зимнего. Но столь же очевидно, что эта информация имеет отношение к разнообразию ландшафта только в том случае, если изображения территорий получены в один и тот же сезон года. Матрица корреляции между «осенними» и «зимними» факторами (табл. 7 ) показывает, что наиболее независимая от сезона года информация о ландшафте содержится в первом факторе каждого факторного пространства (коэффициент корреляции между каналами 0,76). Однако все-таки в каждом первом факторе, отражающем более 90% всей информации, содержащейся в сезонном изображении, и существует собственная информация о ландшафте, выявляемая только в этом конкретном сезоне.
Таблица 6
Дата добавления: 2016-05-25; просмотров: 489;