70
исходном формате. Данные, независимо от источника, могут содержать заметные ошибки,
одни из которых систематические и исправимые, а другие нет. Вам нужно быть в курсе
процедур контроля качества, используемых каждым поставщиком. Кроме того, вам нужно
знать о наличии возможности возврата в случае плохого качества данных. Спросите, где
данные были получены. Были они созданы фирмой квалифицированных профессионалов или
….?
Все эти вопросы важны с точки зрения пригодности данных. К сожалению, сегодня
средний уровень довольно низок. Одни поставщики не желают открывать свои процедуры
контроля качества, другие не могут сделать этого просто из-за отсутствия таковых. Даже
описания самих данных часто не точны или неправильны. Как и при любой покупке, вы
должны требовать полного отчета о том, что получаете. Детали должны включать
конкретный используемый формат данных, процедуры контроля качества, при которых они
были созданы, ожидаемое качество, процедуры возврата поставщику брака и все другие
сведения, которые обеспечат вам гарантию успешной интеграции данных в вашу ГИС.
Поставщиков, которые не соответствуют этим требованиям, следует избегать.
Еще одна большая проблема, которая часто встречается при использовании внешних
БД, должна быть вами воспринята близко к сердцу при подготовке ваших собственных БД.
Базам данных требуется информация об их собственном содержимом; такие метаданные
являются информацией об информации. Распространены две формы метаданных: активные и
пассивные словари данных.
Пассивные словари данных могут включать масштаб, разрешение, названия полей в
БД, используемые коды и их значения. Представьте себе человека, получающего от
поставщика БД, которая содержит категорию, называемую "увлажненные земли" (wetlands,
заболоченные и т.п. территории). Это определение может быть самоочевидным для вас, но
вам нужно больше знать о критериях поставщика для создания данной категории. То, что
является "увлажненными землями" для одного человека, может быть мокрой лужайкой для
другого. Метаданные должны дать достаточно подробностей, чтобы гарантировать, что
любой анализ, основанный на описываемых ими данных, будет корректным. Это, конечно,
должно напомнить вам о необходимости кратко и ясно фиксировать ваши операции в форме,
которая позволит любому человеку, не знакомому с вашими исходными процедурами ввода
БД, воссоздать их.
Активные словари данных работают с БД ГИС, выполняя проверки корректности
запросов и вводимых данных во время функционирования системы. Например, если СУБД
вашей векторной ГИС настроена на только четырехзначные коды для определенных
объектов, то активный словарь данных может проверить каждую операцию, чтобы
гарантировать, что это четырехзначное ограничение повсюду соблюдено. Такие проверки
весьма полезны для обеспечения должного функционирования системы и предупреждения
ошибочных результатов по причине некорректных входных запросов.
Помимо технических, использование внешних БД связано с рядом фундаментальных
законодательных и организационных проблем. Более подробно мы рассмотрим их позднее,
но их необходимо упомянуть для полноты и здесь. Главной организационной проблемой
является то, что эти БД трудно найти, особенно если они создавались в государственных
агентствах, которым может быть поручено распространение, но не продвижение на рынке и
реклама. В Интернете постоянно появляются все новые материалы. Но все это делается по
кусочкам, и неосведомленность о существующих БД часто приводит к дорогостоящему
дублированию работы и данных. Стоимость данных также является организационной
проблемой, которая может ограничить доступ. Причем не столько стоимость отдельных
категорий, сколько частая практика предложения данных большими блоками, которые
покрывают гораздо большие потребности, чем имеет конкретный пользователь.
Среди более сложных вопросов, с которыми имеет дело сегодня пользователь ГИС,
является справедливость платы за данные, созданные при государственном финансировании.