Хранение и редактирование данных
Мы закончили подготовку к исследованию нашего цифрового мира. Но перед тем как начать, хорошо бы проверить то, что мы подготовили. Не забыли ли мы чего? Нет ли в чем ошибок? Доступны ли нам введенные нами данные? Любой анализ должен базироваться на хороших данных, правильно организованных и в должном формате. В цифровом окружении подготовительные операции обширны, потребляя большую часть нашего времени. Каждая точка, линия, область должны быть корректно введены, иначе мы будем путешествовать по бесконечным тропам, искать области, которые должны быть, но их нет. Мы должны быть уверены, что к каждому объекту присоединены корректные атрибуты, дабы избежать поисков отношений, которых не может быть. Возможность ошибки существует для любого создаваемого нами тематического покрытия. А наши БД, скорее всего, будут содержать множество покрытий, дополнительно увеличивая риск внесения ошибок.
Подсистема хранения и редактирования ГИС обеспечивает набор средств для хранения и поддержки цифрового представления наших данных. Она имеет также средства для проверки покрытий на ошибки, которые могли пробраться в наши данные. Перед тем, как мы сможем успешно применять эти средства, нам нужно узнать, каковы эти возможные ошибки, как их обнаруживать и исправлять. Если мы были внимательны при вводе, то количество ошибок не должно быть большим. Но, как мы видели, даже выбор неподходящей величины расстояния неразличимости точек может приводить к ошибкам. Многие из этих ошибок не проявятся, пока не будут организованы завершенные покрытия ГИС. Например, в растре нам может потребоваться отображения каждого тематического покрытия для выявления смещенных ячеек растра при сравнении их со входными документами. В векторных системах может потребоваться построение топологии после начального ввода данных для обнаружения любых незамкнутых областей, линий, которые оканчиваются в ненадлежащих местах, точек, которые оказываются не там, где должны быть. Для проверки соответствия графики и атрибутов нам может потребоваться вывести пробные участки карты для сравнения с исходным материалом.
Как видите, есть множество аспектов обнаружения и исправления ошибок. Читая эту главу, вы встретите термины, которые пригодятся вам не только для построения вашего географического языкового фильтра, но и для подбора методов для обнаружения ошибок и их исправления. При встрече с каждым типом ошибок постарайтесь соотнести его с материалом Главы 5 о вводе. Спросите себя, как можно было бы избежать этих ошибок, прежде всего, с помощью планирования и подготовки перед началом ввода. Составьте список методов, которые способствуют более легкому обнаружению ошибок и последующей идентификации типа каждой ошибки, которая вам встретится. Это могут быть как стандартные подходы, так и подстроенные под ваши нужды, типы используемых данных и типы ошибок, которые вы совершаете систематически. Это в чем-то сходно с созданием собственных макросов текстового редактора для работы с опечатками, которые вы совершаете наиболее часто. Может оказаться, например, что вы постоянно не доводите линии до пересечения с другими объектами. Или вы можете делать ошибки при вводе атрибутов из-за того, что печатаете более медленно, чем читаете. Было бы неплохо потренироваться во вводе на пробных БД и отследить виды ошибок, которые вы делаете. Эта простая предосторожность может помочь избежать многих ошибок до того, как они случились бы, благодаря тому, что ваша осведомленность о собственных слабых местах сделает вас более осторожными при оцифровке.
Некоторые из вас могли иметь возможность поработать с ГИС до начала курса геоинформатики. Этот опыт может привести к почти невыносимому нетерпению поскорее перейти к "деланию" географического анализа, нежели пустой трате времени на это скучное редактирование. Но помните, что, хотя вы и могли увидеть некоторые ошибки и даже исправить их, многие ГИС—профессионалы борются годами со своими ошибками, продолжая совершать их снова и снова. В часто лихорадочном мире коммерческих ГИС-приложений редко находится время для систематического анализа ваших рабочих привычек, когда вам нужно завершить проект "еще вчера". Потратьте дополнительное время сейчас, когда оно не будет стоить денег вам или вашему клиенту. В то же время поделитесь своим опытом с товарищами и преподавателем. Это поможет вам распознать ваши постоянные ошибки и придумать методы их устранения. К тому же, это существенно поднимет уровень понимания во всей вашей группе. И скоро может наступить момент, когда уже вы должны будете учить новых сотрудников построению баз данных. Этот опыт будет неоценимым для вас и вашей работы с ГИС.
ХРАНЕНИЕ БД ГИС
Анализ конкретных компьютерных методов хранения баз данных ГИС далеко выходит за рамки данной книги, также как и всё новых типов аппаратуры, используемой для записи данных. Сами методы также сильно зависят от модели данных, используемой в вашей системе (см. Главу 4). Тем не менее, часть подсистемы хранения и редактирования, относящаяся к хранению, заслуживает упоминания, по меньшей мере, в связи с ее отношением к нуждам редактирования и обновления баз данных.
В растровых системах главными данными являются значения атрибутов ячеек растра, которые хранятся в компьютере обычно на жестком диске, будь то рабочая станция под управлением UNIX или персональный компьютер. Положение каждой ячейки растра определяется относительно положений других ячеек растра. По этой причине редактирование связано главным образом с правильным относительным положением каждой ячейки растра. Некоторые растровые системы, как мы видели в Главе 4, используют методы сжатого хранения, такие как групповое и блочное кодирование, кодирование цепочек растра и квадродеревья. Для действительного определения относительных положений отдельных ячеек растра вы должны иметь возможность выборки данных из запоминающего устройства для отображения таким образом, который позволяет идентифицировать каждую отдельную ячейку растра по номерам колонки и ряда, а также по коду атрибута.
Если ваша растровая система обеспечивает связь с внешней СУБД, вопрос становится несколько сложнее в том, что каждой ячейке растра присоединено несколько различных кодов атрибутов. В зависимости оттого, как это реализуется конкретно в вашей ГИС, вам может потребоваться отображать и анализировать набор атрибутов каждого тематического покрытия как отдельной карты. Другие системы могут давать вам возможность просматривать список кодов атрибутов для каждой ячейки растра при доступе к ней. Вам необходимо познакомиться с возможностями и подходами редактирования в вашем конкретном случае.
В случае векторов графика и атрибуты хранятся либо как отдельные таблицы внутри одной БД, либо как самостоятельные наборы данных, связанные набором указателей. Разделение графики и атрибутов требует от вас внимания к процедурам редактирования, применяемым к графике, атрибутам и базам данных. Вы можете сделать выборку графических объектов и отобразить их для обнаружения пропусков объектов, отсутствующих связей и незамкнутых полигонов. Делая выборки из таблиц атрибутов, вы сможете Просмотреть их отдельно от связанных с ними графических объектов на Предмет выявления опечаток, неправильных кодов или даже помещение правильных атрибутов в неправильные колонки таблицы. Наконец, вы сможете делать выборку части или всей БД, т.е. частей графики и/или частей атрибутов, для проверки их соответствия. Чаще всего у вас будет возможность выделения отдельных графических объектов и отображения на том же экране соответствующих значений атрибутов.
Многие векторные ГИС позволяют хранить отдельно части БД как большие секции для целей архивирования. Эта процедура, называемая мозаичным размещением (tiling), чаще всего используется для уменьшения объема данных, необходимых для единовременного анализа в очень больших БД*. Допустим, вы создаете подробную БД для целой страны. Возможно, вы пожелаете разделить всю БД на мозаичные блоки (tiles), основываясь на координатах отдельных карт (таких как топографические листы), которые вы вводили. Хотя мозаика не требует применения такой формальной схемы, многие считают ее полезной для упрощения управления данными. Кроме того, некоторые проводимые анализы могут потребовать выбора только определенной части БД для работы. А выборка только нужных блоков из всей БД уменьшает вычислительные затраты и ускоряет реакцию системы. Другой важной целью мозаики является обеспечение контроля администратора БД над процедурами редактирования и обновления через разрешение доступа только к определенным частям БД. Когда малые БД части доступны для модификации, система поддерживает оригинальную копию всей БД, пока администратор не убедится, что изменения внесены корректно. Таким образом, разрешая доступ только для тех, кому позволено вносить изменения, можно предотвратить порчу всей БД.
Чаще всего БД полностью редактируется и вычищается перед мозаичным разбиением, архивацией и определением доступа для обновления и анализа. Но так бывает не всегда, и тогда вам придется выбирать подходящие блоки для редактирования. В некоторых случаях может потребоваться выполнение операции увязки по границам блоков для обеспечения стыковки частей объектов, которые пересекают границы блоков.
В общем, современное программное обеспечение ГИС, будь то растровое, векторное или на квадродереве, обеспечивает механизм визуального отображения, который повышает ваши возможности визуализации ошибок. Конкретные методы будут зависеть от используемой модели данных и сложности системы. Поскольку большинство систем дают возможность интерактивного редактирования внутри подсистемы визуализации, то обычно имеется также и возможность корректировать ошибки непосредственно при обнаружении каждой из них. Это было мечтой в прежние времена компьютеризованной картографии, когда приходилось
* Если вы знакомы со структурой данных ГИС ARC/INFO, то наверняка сталкивались с понятием "покрытие", которым там обозначается один лист одного тематического слоя (один блок мозаики). В тексте этой книги покрытие имеет более общее значение, соответствующее тематическому слою или теме карты. — прим. ред.
распечатывать координаты каждого объекта и сравнивать их с записанными для ввода. Все же, несмотря на сложность современного программного обеспечения геоинформационных систем и его способность находить некоторые очевидные ошибки, процесс не является полностью автоматическим. Вы должны активно взаимодействовать с программой, как для обнаружения, так и для устранения ошибок. Это еще один довод в пользу лучшей подготовки карты ко вводу. Подготовленные карты гораздо легче использоваться для проверки цифровой БД.
Дата добавления: 2016-02-24; просмотров: 1350;