Шкалы представления атрибутивных данных
Выбор шкалы измерений определяется:
-тем, что мы классифицируем
-тем, что мы хотим знать о данном явлении
-возможностями проведения измерений при заданном масштабе наблюдений.
На первом уровне находится номинальная шкала, из названия которой следует, что объекты различаются по именам. Использование номинальной шкалы позволяет присвоить каждому объекту собственное имя, но не позволяет проводить сравнение объектов. Мы не можем сравнивать объекты, которые различны по природе – например дуб-клен, лес-поле, девон-карбон (если они не в стратиграфической колонке)
Если необходимо произвести сравнение объектов, следует выбрать шкалу более высокого порядка. Следующая шкала – порядковая. Использование порядковой шкалы позволяет указать место конкретного объекта в определенной последовательности. В качестве примера можно привести спектральную цветовую шкалу. Возможно использование спектра значений от лучшего к худшему, от меньшего к большему и т.п. например – белое-серое-черное, девон-карбон (если они в стратиграфической колонке). Очевидно, что порядковые данные могут дать некоторое представление о последовательном сравнении пространственных объектов, но эти сравнения ограничены данным частным применением.
Если мы хотим быть более точными в своих определениях, нам нужно воспользоваться интервальной шкалой, в которой измеряемым величинам приписываются значения. Как и в случае с порядковой шкалой также существует возможность сравнения свойств объектов, но эти сравнения могут делаться с более точной оценкой различия.
Для возможности количественной оценки свойств объектов необходимо использовать шкалу отношений (метрическую или азимутальную). Здесь применимо понятие абсолютный и относительный. Шкала отношений действительно является абсолютной, т.к. ее начало имеет определенный физический («абсолютный») смысл и не может быть установлена произвольно. Чтобы уменьшить путаницу такую шкалу назвали не относительной шкалой, а шкалой отношений.
Т.о. в нашем распоряжении имеются два типа шкал – качественнаяи количественная. К качественной относят шкалы номинальную (наименований) и порядковую (ранговую). К количественным относят интервальную и шкалу отношений. Различие шкал проиллюстрировано на рисунке 18.
Качественные | Количественные | |||
Шкалы | Номинальная | Порядковая | Интервальная | Рациональная |
Свойства | Наличие/отсутствие Качественное различие Отнесение к одному и тому же или другому классу | Место в определенной последовательности Относительная позиция по сравнению с другими Больше, меньше или равно | Различия Условное начало отчета (условный нуль) Вычитание, сложение | Отношение – во сколько раз Умножение Деление |
Порождаю-щий процесс | Классификация | Ранжирование | Измерения | |
Примеры | Название города Тип землеполь-зования Название шоссе | Большой город Самая богатая гумусом почва Шоссейная дорога местного значения | Температура в градусах Цельсия (не Кельвина! Азимут в градусах) Прирост числа жителей города за 10 лет | Число жителей в городе Площадь Земельного участка Расстояние между двумя горными вершинами |
Рисунок 18. Типы шкал для описания свойств объектов
Нужно заметить, что выделение вышеназванных шкал не имеет ничего общего с формой записи или кодированием значений – данные в номинальной шкале могут быть представлены числом (и часто представляются для обработки в компьютере в виде кодов). Но это число не является численным значением. Существует возможность перехода от представления данных в качественной шкале в вид представления порядковой шкалой, от порядкового представления данных к интервальному, от метрического к порядковому и номинальному, а также ступенчато.
Все допустимые значения атрибута образуют множество, называемое доменом этого атрибута. Атрибут соответствует понятию переменной в языках программирования. Формально атрибут с именем Х представляет собой пару (Х,z), где z - элемент Z. Множество Z называется доменом значений (областью определения атрибута X), величина является значением атрибута Х в заданный момент времени. Определение домена предполагает указание его имени и списка значений. Если число значений в домене невелико, то их список можно указать при объявлении данных в программе.
Любое сообщение записывается в форматированном виде как указание свойств (параметров) предметов, о которых мы говорим. Поэтому информационное отображение любого явления представляет собой набор соответствующим образом подобранных атрибутов. Атрибут характеризуется именем и значением. Именем атрибута называется его условное обозначение в процессе обработки данных.
Зачастую невозможно перечислить все элементы домена, поэтому для домена указываются тип и длина значения. Наиболее употребительны текстовые (символьные), числовые, логические значения и другие специальные типы значений. Для ряда доменов множество входящих в них значений задается с помощью перечисления допустимых значений. Если в домене необходимо перечислить обозначения объектов из некоторого класса, то разрабатывается классификатор, содержащий условные обозначения (коды) отдельных объектов и классов, к которым эти объекты отнесены. В настоящее время разработаны и утверждены классификаторы для создания карт топоосновы разных масштабов, геологических карт по территориям серийных легенд. Использование таких легенд не только удобно при создании цифровых моделей, но и необходимо. Так как только создание карт с использованием единого классификатора делает их доступным для всех пользователей при создании различных проектов.
Атрибуты могут быть первичными (измеренными, введенными) и вторичными (полученными расчетами из других атрибутов).
Атрибутивная информация чаще всего организуется в виде баз данных (БД), реляционного (табличного) типа, каждой записи в которых соответствует один объект или их группа (класс). Формат представления пространственных данных существенно влияет на способ организации атрибутивной информации. Проще всего организация атрибутивной информации осуществляется в векторных ГИС, а особенно в ГИС с объектной топологией, в которых основной составной единицей изображения являются объекты – точки, линии, полигоны. В данном случае каждому объекту соответствует одна запись в базе атрибутивных данных. Более сложно организовать атрибутивную информацию в векторных моделях с топологической структурой. Сложность заключается в том, что одна и та же линия может принадлежать одновременно нескольким объектам, и поэтому отсутствует прямая связь между составными единицами изображения и записями в атрибутивной базе. Еще более сложной является организация атрибутивной информации в растровых ГИС, где составной единицей изображения являются элементарные ячейки – пикселы. Тематические растровые изображения могут иметь базу атрибутивных данных, только в данном случае каждая запись в атрибутивной таблице будет соответствовать не отдельному объекту изображения, а классу объектов.
По мере развития ГИС разнообразие используемых атрибутов увеличивается. Многие ГИС используют графические и аудио-описание (например, растровые образы объектов или их аудио-описание). Графические данные могут выступать в роли иллюстраций – в случае если они не участвуют в анализе (фотоизображения, рисунки, схемы).
Рисунок 19. Свойства (атрибуты) скважины №160 в виде графических изображений
Часть графических изображений могут лишь временно не подвергаться векторизации в целях экономии времени. Так, например, если решение аналитических задач более детальных карт предполагается позже, либо не все объекты пространства интересуют разработчиков проекта в данное время. В этом случае только часть пространства векторизуется, остальная информация может существовать в растровом изображении. Условие существования этого изображения в единых координатах проекта делает ее доступной для анализа на визуальном уровне и доступной для векторизации в любое удобное для пользователя время. Пример такого хранения информации описан в главе, посвященной разработке проекта по архивации данных. Иногда не представляется возможным структурировать текстовое описание объектов в форме атрибутивной таблицы. Это могут быть описание геологического обнажения, история открытия месторождения и многое другое. В этих случаях информация, представленная в виде текста, может быть связана с объектов посредством ссылок. Существуют так называемые атрибуты действия, т.е. функции, которые должны быть выполнены при определенных условиях (например, подсчет вклада объекта в загрязнение атмосферы при выборе этого объекта). Возможно также при активизации объекта (например, геологической карты масштаба 1:200000) перейти к другой карте (детальной карте участка, расположенного в пределах первой карты). Таким образом, более детальную карту, организованную в рамках одного проекта можно рассматривать как атрибут первой карты. Такие виды атрибутов принято называть расширенными атрибутами.
Таким образом, атрибутивные данные (классические или расширенные) придают пространственным объектам некую содержательную сущность, которая и позволяет выполнять основные задачи информационных систем: выборку, обработку, и анализ информации. Объединение пространственных и атрибутивных данных является одной из ключевых концепций ГИС. Данные объединяются для решения каких-либо задач по ряду правил с использованием определенных методов. В следующей главе будет рассмотрен вопрос о том, как правильно организовать связь пространственных и содержательных данных для оптимальной работы, т.е. создать цифровую модель (ЦМ) данных
Дата добавления: 2015-07-06; просмотров: 1692;