
преимущественно западной цивилизации. Тезаурус может использоваться в архивах, музеях и
библиотеках для описания коллекций и при поиске материалов.
Серьезная работа над этим проектом началась в начале 80-х годов, когда Интернет был еще
в мечтах и планах; однако данные создавались с использованием гибкого формата, который
допускал различные версии, включая варианты для открытого доступа через веб, печатные
книги и разные компьютерные форматы. Фонд специально организовал тезаурус таким
образом, чтобы его могли использовать компьютерные программы для поиска информации и
обработки естественного языка.
Тезаурус подразделяется на семь категорий, каждая содержит иерархию терминов.
Категории следующие: ассоциированные концепции, физические атрибуты, стили и периоды,
агенты (agent), деятельности (activity), материалы, объекты. Отдельная концепция представлена
кластером терминов, один из которых определяется как дескриптор (т.е. предпочтительный
термин, preferred term). Тезаурус предоставляет не только термины для обозначения объектов,
но и словарь, используемый для их описания (например, стиль, период, форма, цвет,
конструкция, использование) и образовательные концепции, такие как теории и критика.
Цена разработки и поддержания большго специализированного тезауруса велика. Даже в
устоявшейся области, такой как искусство и архитектура, терминология постоянно меняется, а
технический персонал должен внедрять новые технологии. Только потому, что Фонд весьма
богат, разработка тезауруса продолжается уже много лет.
Дублинское ядро (Dublin Core)
С 1995 года международная группа под руководством Stuart Weibel из OCLC работает над
разработкой простого набора элементов метаданных, которые могли бы применяться для
широкого набора библиотечных материалов. Набор таких элементов, созданный группой,
известен под названием Дублинское ядро по названию города Dublin в штате Огайо, где
расположена штаб-квартира OCLC и где состоялась первая рабочая встреча. Несколько сотен
людей участвовали в рабочих встречах Dublin Core или в обсуждениях посредством
электронной почты. Присущий им дух сотрудничества является примером того, как
индивидуумы с различными интересами могут работать вместе. Пятнадцать элементов,
которые они отобрали, приведены на врезке 10.3.
Простота одновременно является и сильной, и слабой стороной Дублинского ядра. В то
время, когда традиционные правила каталогизирования сложные и длинные, требуют
профессиональной подготовки для эффективного использования, Dublin Core может быть
описан весьма просто. Однако простота конфликтует с точностью. Команда много работала над
этим парадоксом. Первоначальная цель заключалась в создании простого набора элементов
метаданных для неподготовленных людей, которые публикуют электронные материалы с
описанием своих результатов. Некоторые продолжают придерживаться этого минималистского
подхода, они хотели бы видеть простой набор правил, которыми мог бы воспользоваться
любой. Другие предпочитают ориентироваться на преимущества более тщательно
разработанных правил каталогизирования и согласны на увеличение трудоемкости и
стоимости. Они указывают на то, что дополнительные структурные элементы позволяют
добиться большей точности в метаданных. Например, если поле "предмет" (subject)
заполнялось с использованием Девеевского десятичного классификатора, было бы полезно
отразить этот факт в метаданных. Для дальнейшего повышения эффективности метаданных
при обработке информации, предлагается присваивать некоторым элементам некоторые
"значения" (values). Это может быть определенный набор, список типов, которым могут
руководствоваться составители индексов.
Врезка 10.3
Дублинское ядро