Задача 3. Классификация многоканального спектрозонального изображения

Целью решения этой задачи является выделение территорий, различающихся по значениям спектральных яркостей в каналах. При этом имеется в виду, что спектральные яркости отражают некоторые физические свойства ландшафта или его элементов и его отдельных компонентов (растительности, почвы, гидрологического режима и т. п.).

В общем случае классификация есть способ выделения подмножеств объектов – классов, таких, что объекты, принадлежащие к одному классу, более сходны друг с другом или подобны друг другу, относительно объектов принадлежащих другим классам. Классификации нужны постольку, поскольку они позволяют заменить множество элементов, каждый из которых в какой-то степени отличается от любого другого обобщенным классом, содержащим некоторые обобщенные значения переменных, описывающих каждый элемент. Если какой-либо класс, объединяющий множество элементов, устойчив во времени и пространстве, то он получает обычно собственное имя и становится образом множества его частных проявлений. Например, слово «облако» объединяет широкий класс подобных состояний воздушной массы. Слово «сосна» является образом огромного количества индивидуумов растительного мира, каждый из которых очевидно отличим от любого другого. Таким образом, в результате классификации исходное разнообразие уменьшается при минимальной потере содержательной классификации. Идеальной является классификация, при которой по некоторому конечному набору признаков любой объект может быть однозначно отнесен точно к одному классу. Формально такое возможно, если множество строго дискретно, то есть каждая его точка (элемент) содержит информацию обо всем множестве (о всех других точках). Однако таких множеств не так уж много. Они наиболее типичны для систем, образованных на основе управления. Но даже и для таких множеств всегда существует некоторая область неопределенности. Классическим примером являются таксономические классификации, исходно ориентированные на дискретную природу классифицируемых ими множеств. Система населенных пунктов в силу ее генезиса обычно вполне дискретна. Деревни надежно отличимы от городов. Хорошо отличимы города различного иерархического уровня, однако и здесь существуют области неопределенности.

Если множества строго непрерывны, то есть для любой точки в окрестности любого радиуса всегда найдется точка, принадлежащая тому же множеству, то их однозначная классификация невозможна. Классы в таком варианте могут выделять некоторые наиболее вероятные сочетания значений признаков, но при этом всегда будут существовать переходные ситуации. Фрактальные множества являются, с одной стороны, непрерывными, а с другой – разрывными. То есть в любой окрестности любой точки всегда найдется точка, принадлежащая этому множеству, и пустое множество, не содержащее такой точки. Фрактальные множества в силу их разрывности при классификации содержат меньше неопределенных граничных точек, чем в случае строго непрерывного множества, но все-таки существование переходов и неопределенности обязательно. Таким образом, классифицируя конгломеративные системы, какими являются ландшафты, в самом лучшем случае удается выделять области локально устойчивых их состояний, каждая из которых соответствует определенному классу. Эти области локального равновесия, или локальной устойчивости, можно определить как фазовые состояния системы. В ходе пространственно-временной динамики возможен переход любой точки из одного фазового состояния в другое. Фрактальность множества определяет неизбежную иерархичность классификации, когда существуют классы, каждый из которых можно подразделить на подклассы первого уровня, которые в свою очередь делятся на подклассы, и так далее. Для формальных фрактальных моделей такое деление может быть сколь угодно глубоким. При отображении через классификацию реальных природных систем их иерархическая делимость ограничивается неизбежными конечными размерами элемента земной поверхности и в общем случае любого объекта классификации.

Формально, максимальное число классов, которые можно выделить на множестве, прямо связано с его энтропией, или разнообразием, и равно 2^H. Это представление очень близко к понятию числа степеней свобод в статистике, которое связывается с объемом выборки N как df = log₂ (N)+1. Число степеней свободы подразумевает число способов случайного размещения N элементов. Очевидно, оно определяет максимальное разнообразие, которое может содержать ограниченная выборка. Таким образом, число статистически обоснованных классов не может быть больше числа степеней свободы. Так, например, рассматриваемое изображение Московской области содержит 570 690 пикселей и, соответственно, число статистически обеспеченных классов должно быть близким к 13 – 14 для каждого слоя и при условии независимости всех каналов 13⁶. С другой стороны, общее разнообразие летнего и зимнего снимков составляет 11,86 бит, что позволяет в пределе выделить около 2 ^11,861= 3720 статистически различимых классов.

По-видимому, полезно различать генетические и физиономические классификации. Первые строятся на основе сравнения «сходства – различия» физически понятых факторов, определяющих разнообразие состояний классифицируемого явления, вторые – на основе «сходства – различия» каких-либо наблюдаемых и измеримых признаков. Если эти признаки действительно определяют важные функциональные свойства объекта классификации, то физиономическая классификация неизбежно в той или иной степени будет отражать не только физиономическое сходство, но и родство. Однако совпадение генетической и физиономической классификации в общем случае не обязательно. В подавляющем большинстве случаев одно и то же явление может подразделяться на классы различными способами. Выбор способа часто определяется практическими требованиями, предъявляемыми к классификации. Сама возможность множественности классификации определяется разнообразием функциональных отношений, в которых любое явление находится в отношении к человеку. Выше рассматривалось многообразие определений сообщества, местообитания, экосистемы и ландшафта. Выделение этих объектов из разнообразия систем, связанных с планетарными комплексными явлениями, также является результатом их классификации по не очень четко определенным переменным и отношениям. Принимая неизбежность множественности классификаций, обратим внимание на необходимость максимально четкого обоснования и объяснения применяемых правил действий. Только на этой основе можно обеспечить их воспроизводимость и сравнимость.

В конечном итоге, в основе любой классификации явно или не явно заложены метрика и способ группировки конкретных объектов классификации.

Метрика определяет способ измерения «сходства – различия» сравниваемых объектов. Способ группировки определяет правила, по которым классифицируемые объекты объединяются в группы подобных, или классы. Обсуждения всех проблем классификации выходит за рамки настоящего текста. Читатель может ознакомиться с более полным обсуждением этой важной темы в соответствующих изданиях [Айвазян, Михтарян, 1998]. Здесь же остановимся на методах классификации, обеспечивающих соизмеримость оценок ландшафтного разнообразия.

Любые явления можно классифицировать по значениям нескольких переменных двояко:

1) по величине этих переменных,

2) по подобию изменения этих величин.

Действительно, классификация растительности в русской геоботанике опирается в первую очередь на ценозообразующие, то есть многочисленные, виды, а классификация Браун – Бланке оперирует в первую очередь с группой видов, устойчиво встречающихся в определенных сочетаниях, то есть подобно распространенных по местообитания (верные виды).

Два этих варианта классификации строятся на основе двух типов метрик:

1) измеряются различия по участию (сравнение по размеру, объему),

2) измеряются различия по подобию распространения (сравнение по подобию, форме).

При такой трактовке подразумевается, что множество переменных отражает некоторые геометрические фигуры в многомерном пространстве переменных, у которых есть и объем, и форма. При этом объем и форма изменяются однозначно только в одном частном случае. Этот частный случай соответствует линейной модели отношений между переменными. Обычно же изменения значений переменных от объекта к объекту происходят непропорционально. Соответственно, не удивительно, что две классификации, проведенные на основе разных метрик, могут существенно отличаться друг от друга.

Размер можно измерять только в том случае, когда значения переменной могут быть однозначно связаны с натуральным рядом чисел (по схеме больше-меньше ). Однако часто такого порядка в состояниях априори установить невозможно. Так, например, если переменная определена как видовой состав и фиксируется только наличие или отсутствие какого-либо вида в точке территории, и даже при этом рассматривается его обилие, то нет априорных оснований, по которым можно установить естественный порядок, который занимает каждый вид как состояние этой переменной. Такие переменные называются дескриптивными, или описательными, и для измерения дистанций на их основе используются специальные дескриптивные метрики, отображающие в основном форму и лишь частично объем.

Коротко опишем основные метрики этих трех типов и области их применения.

Первый тип метрики, отображающий различия или дистанции между подмножествами по их объему, относительно описывающих их переменных, называется дистанция Минковского и в общем виде записывается как:

D_ij = (Σ¦x_i-x_j¦^p)^1/^q,

где D_ij_– дистанция между точками i и j;

x –- переменные, описывающие множество от 1 до m;

p – степень разности от 1 до k;

q – степень корня из сумм разностей в степени р пар сравниваемых переменных от 1 до k. Обычно k не превышает 3.

Метрика Евклида, используемая в обычной геометрии, получается при p = q = 2. Метрика с p = q = 1 называется дистанция Манхетен – сити.

В зависимости от отношений p и q метрики отображают пространства различной кривизны относительно линейного пространства Евклида. При Манхетен-сити дистанции удаленные точки оказываются ближе, чем в метрике Евклида. Напротив, в пространстве квадратичной или кубичной метрики Евклида, когда p = 2 и 3 соответственно, а q = 1 удаленные точки оказываются дальше, чем в обычной метрики Евклида. Отсюда следует простое правило применения этих метрик:

1) если распределение значений переменных близко к нормальному, то оптимальна метрика Евклида;

2) если распределение имеет очень большой эксцесс, то следует применять дистанцию Манхетен – сити, а в пределе при очень большом положительном эксцессе дистанцию с p = 1, при q > 1;

3) если распределение данных имеет очень большой отрицательный эксцесс и тем более близко к равномерному, то оптимальна дистанция Минковского с p > 1 и q = 1.

Смысл использования метрик довольно прост. Если распределения переменных сосредоточены в узкой области, то редкие экстремальные значения будут входить в оценку дистанции с очень большим весом, и на самом верхнем уровне классификации будут выделяться классы с очень небольшим числом элементов (объектов), противопоставляемые всему основному множеству. Если в задачу классификации входит выделение на первом ее уровне относительно редких типов событий или состояний, то такая метрика вполне приемлема. Если же желательно получить в классификации отображение в первую очередь классов, включающих в себя в среднем наиболее типичные состояния, то необходимо использовать метрику Манхетен – сити, которая снижает вес в классификации экстремальных состояний.

Можно сформулировать задачу иначе. Если мы хотим в общем случае отобразить классы с экстремальными состояниями, то необходимо искривлять пространство таким образом, чтобы состояния с экстремальными значениями переменных имели непропорционально большой вес относительно состояний со средними значениями.

Следует обратить внимание на то, что человек в своем отображении реальности сплошь и рядом интуитивно применяет метрики, искривляющие пространство, и в первую очередь в том случае, когда он хочет выделить классы относительно редких состояний.

Второй тип метрики в общем случае строится на основе мер подобия типа корреляции. При этом в линейном случае применяется метрика, строящаяся на корреляции Пирсона (обычной корреляции, используемой для нормальных распределений):

D_ij = 1-r_ij,

где r_ij – корреляции между двумя точками (i,j) по состояниям k – переменных.

Если отношения сильно нелинейны, то используются ранговые коэффициенты корреляции, однако из-за очень больших затрат времени для расчета применение их при анализе изображений практически нереально.

Для анализа изображений наиболее приемлема метрика, опирающаяся на логику скалярного умножения векторов и неравенство Буняковского.

Сумма скалярных произведений векторов, деленная на квадратный корень из произведения их квадратов, есть косинус многомерного угла в векторном пространстве. Если два вектора полностью тождественны, то косинус равен 1 и дистанция соответственно равна нулю.

Если одноименные переменные в двух точках различаются по величине, но имеют подобный порядок, то их произведение будет меньше квадрата одного из максимальных значений, и среднее значение суммы будет меньше единицы, но все-таки существенно ближе к ней, в сравнении с ситуацией с несовпадающим порядком. Таким образом, эта дистанция более чувствительна к подобию, чем к объему многомерных фигур, но все-таки не является строго корреляционной. Если значения переменных для каждой точки нормировать по амплитуде во всей выборке, то дистанция Буняковского будет строгой метрикой подобия. Однако при анализе изображений при оценке подобия полезно сохранять все-таки и некоторое влияние на дистанцию объема сравниваемых объектов. Часто на этой основе удается получить более содержательные классификации, чем по дистанциям Минковского.

Третий тип метрики, для диссипативных множеств, применим при анализе изображений лишь в частном случае. Типичной задачей является классификация территорий по сочетаниям в их пределах различных классов, не обязательно упорядочиваемых друг относительно друга.

В данном случае точке на карте соответствует квадрат с некоторым числом пикселей, каждый их которых по сравниваемой переменной принадлежит к определенному классу, имеющему свой номер для всего изображения. Если, например, сравниваемые квадраты состоят из k = 25 пикселей, то в них может встречаться не больше 25 классов, представленных своими номерами. Потенциально это может быть любой номер, соответствующий определенному типу. Таким образом, во всех случаях число переменных подразумевается потенциально равным всем классам, многие из которых в сравниваемых квадратах могут быть не представлены, то есть равны 0. Если между двумя сравниваемыми квадратами нет общих классов, то, очевидно, дистанция между ними будет максимальна и равна 1. Если же часть классов совпадает, то в числителе отбирается значение из того квадрата, в котором класс, по которому идет сравнение, встречается минимальное число раз, а в знаменателе, напротив, максимальное число раз. Если все классы с одинаковой частотой встречаются в обоих квадратах, то значение в скобке, очевидно, равно единице, и дистанция соответственно равна нулю. Если же частоты совпадают не по всем классам, то расстояние будет меньше 1, но больше 0. Эта метрика по своей логике очень близка к метрике на основе широко известной меры сходства Жаккара, с той лишь разницей, что в ней учитывается не только наличие, но частота каждого класса.

После того как определена основная схема оценки дистанции между классифицируемыми объектами, естественно перейти к рассмотрению методов классификации.

Традиционно анализ космических снимков и многоканальных изображений сводится к дешифрированию, которое может проводиться как с помощью эвристических визуальных методов, так и более или менее адекватных им алгоритмов. В общем случае подразумевается, что специалист по дешифрированию имеет набор образов, включающий в себя типы растительности и их пространственных сочетаний, различных объектов хозяйственной деятельности, различных типов линейных объектов, рек, дорог и т. п. Сравнивая эти образы, хранящиеся в памяти, с изображением, он выделяет по снимку соответствующие типы объектов в виде полигонов, или линий, и присваивает им обозначения. Любой образ де-факто описывается через яркости изображения в разных каналах или их цветом, представленным в формате RGB (в псевдоцветах), пространственным сочетанием различных яркостей, образующих текстуру изображения, и правилами сочетания этих различных яркостей в пространстве, то есть их упорядоченностью, порождающей структуру изображения.

Основной проблемой эвристического дешифрирования является неоднозначность выделения границ между образами, которые далеко не всегда имеют строго дискретный характер; отсутствие в изображении информации, различающей априорные образы; очень большое реальное разнообразие изображения, не обеспеченное существующими представлениями об образах.

Алгоритмические процедуры классификации, строящиеся на использовании априорных образов, называются классификацией с «учителем». «Учитель» указывает на снимке эталон в его некоторых границах и программа, используя статистические процедуры распознавания, ищет на изображении его аналоги. В идеале алгоритм распознавания должен использовать три типа информации: информацию о распределении яркостей в рамках эталона во всех каналах, информацию о текстуре и структуре. Однако чаще используется простейший алгоритм, оперирующий распознаванием на основе соотношения яркостей в разных каналах. В последнее время появляются алгоритмы, использующие дополнительную информацию о текстуре. Однако в этом случае возникает вопрос: какой размер квадрата надо использовать для оценки текстуры? Обычно алгоритмы распознавания с «учителем», в том числе и самообучающиеся, и адаптивные в лучшем случае обеспечивают точность, не превышающую 80%. Вместе с тем существуют все основания для развития этих алгоритмов, и в конечном итоге они могут и должны стать надежней традиционной работы дешифратора, так как наряду с распознаванием будут оценивать и риск ошибки, и набор образов, в пределах которых в первую очередь происходит ошибка.

Второй подход сводится к идеологии создания набора образов (или классов) по самому изображению, а затем сопоставление этих образов с априорными представлениями.

Проблемы такого подхода, как указывалось выше, связаны с выбором метрики и метода классификации. В общем случае, основные методы классификации по своей идеологии, так или иначе, согласуются с разнообразием приемов интуитивной классификации изображения, осуществляемым в реальной жизни любым человеком.

Можно выделить два основных подхода: классификацию сверху и классификацию снизу. В первом случае наблюдатель разбивает все множество на две взаимно дополняющие части, например темные точки и светлые точки. Затем каждое из этих подмножеств вновь делится на два и т. д. Точно так же может идти классификация и по текстуре: текстура выражена хорошо, текстура слабо выражена и т. п. При анализе снимка сначала можно провести границы между темными и светлыми контурами, а затем границы внутри каждого контура.

При классификации снизу сравниваются обычно соседние объекты и ищут точки смены яркости и текстуры изображения при принятом пороге различий. Затем выделенные территориальные образы упорядочивают по подобию относительно друг друга. Можно взять в качестве эталона какой-либо опорный объект и в соответствии с принятой метрикой подбирать к нему наиболее близкие элементы. После того как перебраны все объекты, то следующий, наиболее близкий к первому, становится новым опорным и т. д. Такой метод называют методом «ближайшего соседа». Можно построить и противоположный алгоритм, при котором находится элемент, наиболее удаленный от первого, и все элементы по значениям дистанций относятся или к первому, или ко второму элементу. Можно построить алгоритм таким образом, чтобы он минимизировал дисперсию, или разброс по дистанциям, в выделенных классах.

Классификация может строить дихотомический дендрит с правильной структурой (первые два класса имеют самый высокий иерархический уровень), может выделять задаваемое число классов, может строить системы, включения классов типа «виноградной грозди».

Выбор метода классификации определяется целями исследования и вычислительными возможностями. Для классификации изображений обычно используется метод типа K – средних с его различными модификациями. Для работы с изображениями большого объема с использованием широкого набора метрик можно использовать процедуры классификации, предлагаемые, например, в пакете программ анализа изображений Idrisi. Если этот пакет недоступен, то можно воспользоваться любым пакетом статистических программ SPSS, SYSTAT, NCSS, SAS, позволяющих классифицировать большие массивы данных. При этом удобнее всего последовательно применять метод К – средних, положив для первой операции K = 2.

В результате на первом шаге будет получено два класса. Затем следует повторить двоичное разбиение для каждого класса и т. д. до 5 – 8 уровней. Дихотомическое разбиение наиболее удобно при интерпретации данных с использованием очевидной априорной информации и яркостей каналов.

Продемонстрируем последовательно эту процедуру.

На рис. 21 приведен первый уровень классификации по осеннему и зимнему изображению по двум метрикам. Подобие двух вариантов вполне очевидно. Точно так же очевидно, что первый тип в обоих случаях по метрике Евклида выделяет сельскохозяйственные земли, а по метрике Буняковского практически те же территории выделяются в первом канале. В отличие от остальной территории, выделенной зеленым цветом, сельскохозяйственные земли имеют наибольшую яркость во всех каналах и в любой сезон. В табл. 2 демонстрируется связь двух вариантов классификаций. Их подобие на первом уровне вполне очевидно. В целом открытых, скорее всего сельскохозяйственных, земель в рассматриваемом регионе по классификации с метрикой Евклида 59,2%, а по метрике Буняковского –57,5%.

Таблица 13

<78 9 10 11 12 13 >

Дата добавления: 2016-05-25; просмотров: 845;