Подготовка карты и процесс оцифровки
Начинать оцифровку следует с сообщения программе соответствующей информации о проекции, системе координат и т.д. Это часть процесса подготовки карты, которым так часто пренебрегают, но который очень важен для создания пригодной базы данных. Многие программы потребуют от вас эту информацию перед тем, как вы сможете начать, хотя другие позволяют ввести эту информацию позже. В любом случае вам следует предварительно ее подготовить и держать под рукой, чтобы знать, какова она и где ее найти.
Неплохо было бы также перед началом оцифровки сделать соответствующие пометки прямо на карте или на прикрепленной прозрачной пленке для идентификации тех мест, которые вы собираетесь оцифровывать. Помните, на карте будет множество кривых линий, которые вам придется сводить к набору коротких прямых отрезков. Хотя многие предпочитают цифровать без подготовки, если вы знаете все точки, которые будут оцифровываться (какие из них являются начальными и конечными точками границ полигонов, какие — узлами и т.д.), то вам не придется повторять эту утомительную процедуру во время оцифровки.
Поскольку оцифровка - работа монотонная, вам, возможно, захочется выполнить ее за несколько этапов. Это тем более говорит в пользу подготовки карты заранее, отмечая на карте части, которые вы собираетесь вводить за каждую сессию. Правда, при этом вам скорее всего придется иногда снимать карту со стола дигитайзера, чтобы дать и другим возможность на нем поработать, поэтому придется сообщать программе, где на карте находится оцифровываемая часть. Для этого используютсяточки привязки, или регистрационные, координаты которых вводятся в пространстве как дигитайзера, так и карты. Их тоже нужно отметить на карте для того, чтобы и вы и компьютер знали, где они находятся. Точки привязки обозначают внешнюю границу карты и должны находиться снаружи любого объекта, который вы собираетесь оцифровывать, включая рамку карты, если вы собираетесь вводить ее в БД ГИС. Обычно программе требуются три точки по углам прямоугольника для определения области карты. Некоторые могут обойтись и двумя, если они расположены на диагонали. В этом случае программа считает, что внешняя граница является прямоугольником и вычисляет остальные два угла. Независимо от того, какой метод используется в вашем случае, для обеспечения хорошего качества работы совершенно необходимо точно указывать положения точек привязки. Неплохо даже перепроверить их, так как если они указаны неточно, вся дальнейшая оцифровка будет ошибочной.
Другие приготовления карты включают четкое определение порядка, в котором вы намереваетесь производить оцифровку. Неплохо бы также придумать метод идентификации уже оцифрованных областей (секций, линий, точек и т.д.). Периодические перерывы в оцифровке для пометки карты фломастером помогут вам отслеживать ваше продвижение и снимут напряжение процесса. Используемая вами программа может потребовать указания узлов, левых и правых областей и т.п. в зависимости от ее сложности и используемой модели графических данных. Эту информацию также следует нанести прямо на карту, чтобы не приходилось останавливаться слишком часто для выяснения этой информации.
Большинство программ оцифровки имеют возможность редактирования для устранения допущенных вами ошибок. Фактически, некоторые программные пакеты позволяют использовать для оцифровки свою подсистему редактирования, давая тем самым возможность редактирования во время оцифровки. Мы обсудим виды возможных ошибок и методы их устранения в следующей главе. Пока же отметим, что большинство программ оцифровки имеют способность компенсировать дрожание руки, определяемую величиной расстояния неразличимости точек. Ее введение вызвано тем, что вы, как правило, не можете поместить перекрестие курсора дигитайзера точно на одно и то же место дважды, что необходимо для установления идентичности начальной и конечной точек замкнутой линии. Люди обычно не обладают проворностью, достаточной для выполнения таких высокоточных движений и, конечно, свою играют роль ограничения самих дигитайзеров. Расстояние неразличимости точек может устанавливаться до начала оцифровки или в дальнейшем, во время редактирования. В любом случае для этого параметра вам нужно выбрать золотую середину между обеспечением достаточной точности оцифровки и несовершенством процедуры ввода. Слишком малая его величина делает оцифровку более чувствительной к ошибкам, что может привести к разнесенности точек, которые должны быть совмещены. И наоборот, слишком большое его значение может привести к слиянию раздельных точек и линий, поскольку программа решит, что их несовпадение — результат ошибки оператора. Мы поговорим об этом подробнее, когда будем рассматривать подсистему хранения и редактирования в следующей главе. Глава 6 дает и другие подсказки для повышения вероятности создания хорошего, свободного от ошибок продукта. Вдобавок, вы можете обратиться к специальной статье [Marble et al., 1990], посвященной всей системе оцифровки, особенно для организаций и коммерческих предприятий.
Последние приготовления карты имеют дело в основном со склонностью материала карты изменять свои размеры при изменении влажности и температуры. Стабильный материал, типа пластика, более устойчив в этом отношении, чем бумага. Хотя он также меняет размеры при изменении температуры, но все же гораздо меньше, чем бумага. Кроме того, он гораздо менее чувствителен к изменениям влажности. Хотя это свойство материала может показаться незначительным, посмотрите на большие бумажные постеры, прикрепленные к стене кнопками по краям. Поместив руку в центр постера, вы обнаружите значительный люфт бумаги. Весь постер может даже провиснуть на кнопках. Это обусловлено скорее всего не тем, что он был плохо подвешен, а тем, что материал расширился в результате перемен температуры и влажности, и под действием силы тяжести растянулся.
Существуют несколько способов ограничения количества ошибок оцифровки из-за нестабильности и хрупкости материала. Во-первых, помещение должно быть оборудовано устройствами поддержания стандартной невысокой температуры и низкого уровня влажности. Нужно дать картам, которые вы собираетесь оцифровывать, несколько часов пребывания в помещении, причем в развернутом состоянии (вообще-то, следует избегать использования складываемых карт, так как сгибы значительно снижают их точность). Для фиксации карты можно нанести полоски скотча вдоль ее краев, поверх которых будут прилепляться отрезки фиксирующего скотча. Нельзя использовать клей, и прилеплять фиксирующий скотч непосредственно к бумаге, что может привести к порыву карты или сдиранию изображения при ее смещении. Кроме того, они могут затруднить удаление карты со стола, создавая избыточное натяжение, которое может привести к ее необратимому растяжению. Карту следует размещать так, чтобы вам не приходилось сильно напрягаться для помещения курсора дигитайзера на нужные объекты, поскольку это может создать излишнее напряжение материала карты и ограничить свободу вашего перемещения, добавляя ошибок в создаваемую базу данных. При оцифровке в несколько сессий, храните карту в комнате с такими же климатическими условиями, дабы избежать ее деформации.
ЧТО ВВОДИТЬ
Теперь, после того, как мы получили некоторые основные наставления по оцифровке, особенно о том, как избегать ошибок в этом процессе, мы можем выбрать подходящие для ввода данные. Большинство книг и даже большинство руководств по программам проливают мало света на этот вопрос. Это похоже на начало путешествия, когда вам наказывают тщательно упаковать все оборудование, но не дают даже намека на то, что это за оборудование. Каждое путешествие в цифровой мир уникально, каждая среда требует разных покрытий и каждая потребность путешествия в геоинформатику требует отдельного набора критериев. Мы попытаемся с этим разобраться, чтобы получить простой набор инструкций, применимый в любых обстоятельствах.
Главным фактором, определяющим, что картографы помещают на карту и как ее создают, является целевая аудитория, пользователи. То же самое можно сказать и о создании БД ГИС. Исторически сложилось так, что во многие ГИС, включая и те, что создавались для целых штатов, вводилось всё [DeMers and Fisher, 1991; Fisher and DeMers, 1990]. Как мы увидим в Главе 15, очень часто это приводило к неработоспособности системы. Поэтому правило номер один гласит: прежде всего определите, для чего вы создаете БД ГИС. Это по меньшей мере ограничит ввод данных темами, которые скорее всего будут использоваться. Хотя и впрямь замечательная карта геологии четвертичного периода кажется очень естественным материалом для ввода, во-первых потому, что она есть, а во-вторых потому, что она такого хорошего качества, скорее всего она вообще никому не понадобится в исследованиях загрязнения атмосферы, вызванного заводскими трубами. Из этого вы должны понять, что вводимые тематические покрытия должны быть прямо связаны с моделированием и анализом, которые вы намереваетесь выполнять, и результатами, которые намереваетесь получить. Если вам так уж хочется ввести карту четвертичной геологии, то лучше сохраните ее в отдельном файле или отложите для более позднего ввода, если он действительно понадобится.
Необходимость определения того, какие покрытия понадобятся в будущем, представляет собой некоторую проблему, особенно если вы или ваш заказчик имеете только зачаточные представления о том, что должно быть сделано. Полагаясь на авось, можно отлично провести время, но, скорее всего, ГИС, созданная при таких обстоятельствах, не даст полезных результатов без значительных переработок, поправок, улучшений и обходных приемов. А этот подход сегодня оказывается довольно дорогим. Возможно, единственным случаем, когда база данных может создаваться без четкого понимания предполагаемого результата (иногда называемого пространственно-информационным продуктом (spatial information product)), являются проекты, главная цель которых - определить возможные взаимосвязи между данными тематических покрытий для формулирования начальной научной гипотезы. Этот подход не приемлем для коммерческих проектов. Поэтому правило номер два, связанное с первым, требует как можно более точного определения целей перед выбором тематических покрытий.
Даже при очень конкретных целях и определенных пространственно-информационных продуктах в некоторых случаях могут быть несколько путей получения данных. Например, теперь координаты местоположений и отметки высоты могут быть получены с помощью GPS-приемников. Но они могут быть взяты и с существующих карт с достаточно высокой точностью. Или, данные о землепользовании могут быть получены из наземных исследований, аэрофотосъемки, со спутников, авиационных сканеров, из числа других источников. Нелегко ответить, какой следует Использовать. Но хотя нет рецепта успеха, зато есть рецепт провала. Что ведет нас к правилу третьему: избегайте использования данных из экзотических источников, когда имеются обычные, особенно если последние обеспечивают сходный уровень точности. Что такое "экзотические", вы определите сами для своего проекта. В общем, я бы использовал практическое определение, применяя данный термин по отношению к любым источникам данных, с которыми я не знаком. Если вы или другие члены вашего коллектива знакомы с данным набором информации и можете спокойно использовать его правильным образом, и если он повышает точность или полезность вашей БД, то его следует использовать. Если все ваши источники данных для определенной темы или покрытия имеются в традиционной форме, то вот правило четвертое: используйте наилучшие, наиболее точные данные, необходимые для вашей задачи.
Вам следует помнить, что "точность" в данной ситуации относится к необходимой, а не в принципе достижимой точности. Вам, наверное, не будет нужен одно-сантиметровый шаг изолиний рельефа, даже если такая карта существует; лучше использовать данные, которые наиболее близки к вашему уровню наблюдений. Хотя предельно детальная карта любого покрытия может выглядеть полезной, ее ввод обойдется дороже, анализ будет более медленным и, возможно, более трудным. Вот пример использования тематических (ТМ) данных разрешения 30 м со спутника LANDSAT по сравнению с многозональными (MSS) данными разрешения 80 м из того же источника. Допустим, вам нужно идентифицировать большие поля, засеянные зерновыми. Поскольку более высокое пространственное разрешение в первом случае, как известно, создает множество трудноразделимых категорий на одной территории, которая вся, по сути, -зерновые поля, более высокое разрешение скорее запутает вам дело, нежели упростит его. И конечно, вычислительные и людские ресурсы, необходимые для прояснения ситуации, повысят общую стоимость системы, не говоря уже о значительно различающейся стоимости исходных данных. Таким образом, мы получаем правило пятое: выбирайте адекватный уровень точности данных.
Еще один вопрос о том, что вводить, имеет некоторое отношение к последней теме об источниках данных. Большинство тематических карт (например, топографические карты USGS) содержат также информацию о дорогах и других антропогенных объектах, которые могут быть очень полезными для ввода в ГИС. Везде, где возможно, и где их качество приемлемо, вам следует вводить эти данные как отдельные покрытия с того же листа карты. Это - правило шестое. Это правило не запрещает использование других источников высокого качества или высокой точности, но оно дает два преимущества. Во-первых, поскольку данные находятся на одной карте, вам не придется иметь дело с несколькими листами и повторять все предварительные операции по подготовке карт. Во-вторых, поскольку данные находятся на одном листе, они уже географически привязаны, уменьшая потребность в выполнении этой иногда трудной задачи позднее.
Последнее правило, седьмое, гласит, что каждое покрытие должно быть как можно более специализированным. То есть покрытия должны быть как можно уже специализированы по темам, не полагаясь на системы вроде IMGRID. Чем более специализировано покрытие, тем легче выполнять поиск, если вы хотите узнать что-то, что относится к данным, содержащимся в одном покрытии. Кроме того, при выполнении операций наподобие наложения покрытий (см. Главу 13), легче отслеживать процесс, если вы хорошо знакомы с данными. Операции наложения упрощаются и для самого компьютера, если в заданном покрытии нет лишних данных.
Эти правила мы можем выразить несколькими короткими предложениями. Первое, определитесь с целью. Далее, удостоверьтесь, что карты соответствуют цели. Используйте наиболее точные для данной цели карты — не слишком точные для ваших нужд и не слишком неточные для выполнения работы. Делайте покрытия простыми и используйте ту же карту для получения этих простых покрытий всегда, когда это оправданно и возможно, дабы избежать необходимости совмещения. Прежде всего, подумайте о вашем проекте до того, как начать ввод данных. Ввод данных требует времени и денег.
КАК МНОГО ВВОДИТЬ
Вопрос о том, какой объем данных вводить, связан с типами вводимых данных. Опять же, используя нашу аналогию с реальным путешествием, скажем, что при подготовке вы должны знать, сколько еды взять, а не только каких видов. Если еды слишком много, вам придется тащить ненужный груз в течение всего путешествия. Если еды недостаточно, то вам придется закончить путешествие раньше, чтобы отправиться на поиски пищи. Подобно этому, если в ГИС введено слишком много данных, ей придется нести груз этого избытка на протяжении времени жизни проекта, если же данных недостаточно, то вы можете оказаться неспособны ответить на вопросы, которые планировали выяснять.
Как и при подготовке путешествия, ввод данных в компьютер - это процесс выбора. В векторной ГИС каждая линия, которую вы вводите, наверняка будет иметь некоторую кривизну. Для того чтобы сделать достаточно точную копию с помощью прямых отрезков, вам придется тысячи раз решать, где поместить курсор дигитайзера. Этот процесс похож на генерализацию (упрощение) линий, с которой мы столкнулись ранее при рассмотрении картографии. Простое правило гласит, что нужно записывать больше точек для более сложных объектов, чем для простых (Рисунок 5.5).
Положение прямой линии может быть точно определено всего лишь двумя точками. Но мне приходилось встречать проекты, где границы правильных квадратов состояли из ни много, ни мало двух тысяч сегментов. Это не только загромождает компьютер мегабайтами ненужной информации и замедляет вычисления, но и делает маловероятным то, что прямые линии будут выглядеть действительно прямыми при выводе.
Рисунок 5.5. Оцифровка сложной линии. Пример аппроксимации прямыми отрезками при дискретизации кривой линии. Записываемые точки выбираются в зависимости от изменения направления линии. Каждая точка — дополнительная порция информации, содержащейся на карте.
Сложность линий и многоугольников можно сравнить с количеством информации, характеристикой, рассматриваемой в теории информации [Shannon, 1948]. Чем чаще линия меняет направление, тем больше информации она содержит (то же относится к поверхностям, но это мы обсудим позже). И чем плотнее расположены точки, линии и области, тем больший объем информации содержит карта. А чем выше объем информации, тем чаще требуется брать отсчеты при оцифровке. Это тем более говорит в пользу Тщательной подготовки карты. Вы должны также помнить, что для каждого объекта, вводимого в ГИС, будет вводиться и атрибутивная информация, и что существует прямая зависимость между сложностью карты, или объемом информации в ней, и проблемами хранения" и обработки пространственных данных [Calkins, 1975].
Идея с количеством информации может быть применена и к растровым данным. Опять же, общее правило таково: чем мельче объекты, которые должны распознаваться в вашей системе, тем мельче должны быть ячейки растра [DeMers, 1992]. Этот принцип часто определяет выбор размера ячеек (разрешение) всей базы данных. Конечно же, теория информация может быть применена и ко вводу растровых данных. Допустим, вы хотите использовать растр для представления ферм, отображенных на карте. Если наименьшая ферма занимает 40 га, то пикселы должны быть по меньшей мере вчетверо меньшей площади (вдвое по длине стороны), чтобы гарантировать обнаружение этой фермы в вашей ГИС. Иначе говоря, это значит, что ячейки растра должны быть по 10 га или мельче, чтобы обеспечить представление объектов площадью 40 га. Но если поле растянуто вдоль береговой линии? Хотя его площадь составляет 40 га, оно вытянуто как линейный объект, уменьшая шансы того, что все оно будет введено в вашу ГИС. Эта сторона процесса определяется в некоторой степени методом, с помощью которого вы вводите ячейки растра. Подробно мы рассмотрим это в дальнейшем, а пока отметим то же практическое правило: делайте больше отсчетов при большем объеме информации.
Как для растра, так и для векторов, требуемая точность зависит от площади, покрываемой картой и назначением вводимых данных. Карты мелкого масштаба, покрывающие большие площади земли, содержат гораздо более общий вид земной поверхности. Кроме того, линии и символы, расположенные на карте, сами занимают некоторую площадь. Величина ошибки, заключенной в символе, зависит от масштаба карты, на которой он помещен. Линии на мелкомасштабных картах занимают больше площади земли, чем линии того же размера на крупномасштабных картах. Это физическое условие, называемое масштабно-зависимой ошибкой, говорит о том, что величина ошибки напрямую связана с масштабом карты и должна учитываться при подготовке карты перед оцифровкой.
Дата добавления: 2016-02-24; просмотров: 2177;