ВНЕШНИЕ БАЗЫ ДАННЫХ
Эффективным подходом к построению БД ГИС является прежде всего ограничение времени и стоимости разработки БД. К счастью, появляется все больше общедоступных цифровых баз данных. Цифровые модели рельефа, цифровые ортофото и другие цифровые материалы могут быть получены у USGS и третьих сторон (см. Приложение 1). Бюро переписи США имеет файлы TIGER и DIME, как и его канадские коллеги (см. Приложение 1). Департамент сельского хозяйства США выпускает карты почв, доступные в цифровой форме. Есть, конечно, множество и других примеров. По существу, рост числа членов все более активной и заметной группы предпринимателей в области цифровых данных обещает обеспечить столь нужные для ГИС-аналитиков данные. Эти организации, чья реклама регулярно появляется в таких коммерческих журналах по геоинформационным системам, как GIS World и Geoinfo Systems, заполняют существенный пробел в инфраструктуре ГИС.
Но наличие готовых баз данных привносит другие проблемы, включая некоторые из тех, с которыми вы столкнетесь при вводе данных в ГИС. Мы рассмотрим эти технические проблемы с точки зрения того, как мы, как потенциальные поставщики БД, можем их избежать. Первой проблемой является тип и формат носителя. Можно потратить дни, и даже месяцы, на поиск цифровых данных в нужном виде. Как мы увидим в следующей главе, существуют множество типов и форматов, от магнитных лент до компакт-дисков, от простейших до весьма экзотических структур файлов. Вам же нужно получить данные в том виде, который "понимают" ваше устройство чтения и программа. Хотя это кажется очевидным, но если вы не укажете нужный вам формат файла и тип носителя явным образом, поставщик может предоставить вам данные "в стандартной упаковке", что будет для вас бесполезным. Мы не будем здесь вдаваться в подробности форматов и стандартов обмена данными [Moellering, 1992], однако, вам необходимо будет знать, какие форматы данных ваша система может считывать и записывать. Технические подробности вы узнаете по мере приобретения опыта работы с вашей системой.
Более коварная проблема с внешними БД связана с качеством данных. Хотя некоторые вторичные поставщики данных могут предложить более легкий к доступ к данным, нежели государственные учреждения, вам нужно знать, что они могут поставлять данные не в исходном формате. Данные, независимо от источника, могут содержать заметные ошибки, одни из которых систематические и исправимые, а другие - нет. Вам нужно быть в курсе процедур контроля качества, используемых каждым поставщиком. Кроме того, вам нужно знать о наличии возможности возврата в случае плохого качества данных. Спросите, где данные были получены. Были они созданы фирмой квалифицированных профессионалов или получены из потогонных цифровых мастерских, часто управляемых низкооплачиваемыми и необученными личностями?
Все эти вопросы важны с точки зрения пригодности данных. К сожалению, сегодня средний уровень довольно низок. Одни поставщики не желают открывать свои процедуры контроля качества, другие не могут сделать этого просто из-за отсутствия таковых. Даже описания самих данных часто не точны или неправильны. Как и при любой покупке, вы должны требовать полного отчета о том, что получаете. Детали должны включать конкретный используемый формат данных, процедуры контроля качества, при которых они были созданы, ожидаемое качество, процедуры возврата поставщику брака и все другие сведения, которые обеспечат вам гарантию успешной интеграции данных в вашу ГИС. Поставщиков, которые не соответствуют этим требованиям, следует избегать.
Одна большая проблема, которая часто встречается при использовании внешних БД, должна быть вами воспринята близко к сердцу при подготовке ваших собственных БД. Базам данных требуется информация об их собственном содержимом; такиеметаданные являются информацией об информации. Распространены две формы метаданных: активные и пассивные словари данных.
Пассивные словари данных могут включать масштаб, разрешение, названия полей в БД, используемые коды и их значения. Представьте себе человека, получающего от поставщика БД, которая содержит категорию, называемую "увлажненные земли" (wetlands, заболоченные и т.п. территории). Это определение может быть самоочевидным для вас, но вам нужно больше знать о критериях поставщика для создания данной категории. То, что является "увлажненными землями" для одного человека, может быть мокрой лужайкой для другого. Метаданные должны дать достаточно подробностей, чтобы гарантировать, что любой анализ, основанный на описываемых ими данных, будет корректным. Это, конечно, должно напомнить вам о необходимости кратко и ясно фиксировать ваши операции в форме, которая позволит любому человеку, не знакомому с вашими исходными процедурами ввода БД, воссоздать их.
Активные словари данных работают с БД ГИС, выполняя проверки корректности запросов и вводимых данных во время функционирования системы. Например, если СУБД вашей векторной ГИС настроена на только четырехзначные коды для определенных объектов, то активный словарь Данных может проверить каждую операцию, чтобы гарантировать, что это четырехзначное ограничение повсюду соблюдено. Такие проверки весьма полезны для обеспечения должного функционирования системы и предупреждения ошибочных результатов по причине некорректных входных запросов.
Помимо технических, использование внешних БД связано с рядом фундаментальных законодательных и организационных проблем. Более подробно мы рассмотрим их позднее, но их необходимо упомянуть для полноты и здесь. Главной организационной проблемой является то, что эти БД трудно найти, особенно если они создавались в государственных агентствах, которым может быть поручено распространение, но не продвижение на рынке и реклама. В настоящее время не предпринимаются значительные усилия для объединения каталогов БД ГИС для облегчения поиска, хотя в Интернете постоянно появляются все новые материалы. Но все это делается по кусочкам, и неосведомленность о существующих БД часто приводит к дорогостоящему дублированию работы и данных. Стоимость данных также является организационной проблемой, которая может ограничить доступ. Причем не столько стоимость отдельных категорий, сколько частая практика предложения данных большими блоками, которые покрывают гораздо большие потребности, чем имеет конкретный пользователь.
Среди более тернистых вопросов, с которыми имеет дело сегодня пользователь ГИС, является справедливость платы за данные, созданные при государственном финансировании. С этим, конечно, связаны проблемы доступа к данным и секретности [Dando, 1991; Davies, 1982; Rhind, 1992]. Хотя многие полагают, что опубликованные данные должны быть легко доступны для всех, проблема потенциально опасных данных, таких как точные местоположения животных исчезающих видов или военных объектов, делает этот вопрос гораздо менее простым. Даже когда данные могут быть получены в соответствии с Актом о свободе информации США, время, необходимое для подготовки всех требуемых документов, может превысить жизненный цикл проекта, для которого эти данные нужны. Эти проблемы не решаются легко, но вы так или иначе столкнетесь с ними в своем путешествии в мир компьютерной географии.
Вопросы
1. Какие общие характеристики присущи каждому из четырех методов ввода данных в ГИС?
2. Каковы пять параметров, помимо цены, которые должны быть рассмотрены при выборе дигитайзера? Опишите их.
3. Каковы принципиальные различия между различными типами сканеров? Какие потенциальные проблемы являются источником ошибок при использовании сканеров?
4. Преобразование между растровым и векторным представлением данных может ухудшить их качество. Какая главная проблема может возникнуть при векторно-растровом преобразовании? Где это может случиться скорее всего? Какая проблема часто возникает при растрово-векторном преобразовании?
5. Опишите преобразования, имеющие место при переходе от координат оцифровываемой карты к географическим координатам и, в конце концов, к выходной карте. Что такое обратная картографическая проекция?
6. Проиллюстрируйте процессы переноса, поворота и масштабирования (гомотетии). Почему они важны для подсистемы ввода ГИС?
7. Почему подготовка карт важна для ввода данных в ГИС? Для чего используются точки привязки?
8. Зачем нужно помечать объекты карты перед оцифровкой? Какую информацию вы должны поместить на подготавливаемую карту? Почему вы должны включать информацию о проекции и координатной сетке, если дигитайзер работает в декартовых координатах?
9. Что такое расстояние неразличимости точек? Каково его значение? Какие сложности могут возникнуть, если оно установлено слишком низким? Если слишком высоким?
10. Каково потенциальное воздействие материала карты на процесс оцифровки? Что можно предпринять для уменьшения погрешности, вызванной деформацией материала?
11. Как вы выберете, что вводить в ГИС? Что такое пространственно-информационный продукт и как он связан с вводом в ГИС?
12. Перечислите и объясните семь правил, определяющих, что должно вводиться в ГИС.
13. Каково практическое правило, помогающее определить, как много информации следует вводить? Что мы имеем в виду, когда говорим, что оцифровка является разновидностью отбора?
14. Что общего между вводом данных и теорией информации? Какое общее правило предлагает теория информации для ввода данных?
15. Что такое масштабно-зависимая ошибка? Как она связана с подсистемой ввода ГИС?
16. Почему нужно читать руководства по программному обеспечению при вводе векторных данных? Нельзя ли обойтись указанием на точку и нажатием на кнопку? Для чего используются пронумерованные кнопки на курсоре дигитайзера? Что вы можете сделать во время оцифровки, чтобы в дальнейшем сократить редактирование?
17. Что есть критичного во вводе атрибутивных данных для векторных объектов? Какова основная проблема, которая может возникнуть, если он выполнен недостаточно тщательно? Почему эту ситуацию так трудно обнаружить в дальнейшем?
18. Каковы основные методы ввода растровых данных? Чем они различаются? Каковы преимущества и недостатки каждого?
19. Какие технические проблемы связаны с использованием данных аэрофотосъемки для ввода в ГИС? Как насчет цифровых спутниковых данных? Что такое опорные точки и почему они важны при использовании ДДЗ? Какие организационные проблемы связаны с использованием ДДЗ для ввода в ГИС?
20. Какое положительное воздействие могут оказать внешние БД на рост геоинформационной индустрии? Каковы некоторые из наиболее крупных технических и организационных проблем в использовании внешних БД? Почему так важны метаданные и словари данных? Какова разница между активными и пассивными словарями данных?
Глава 6
Дата добавления: 2016-02-24; просмотров: 1182;