Модель документа (схема метаданных)
Научить компьютер понимать содержимое документа, т.е. анализировать его
структуру также, как это делает человек - дело будущего, да и при этом узнать,
например, кто автор документа, можно только в том случае, если в тексте документа
это явно указано каким-либо способом. Если ресурс (объект описания) достаточно
сложный, имеет разнообразные характеристики (атрибуты, свойства), состоит из
нескольких частей, (которые в свою очередь, тоже можно считать объектами),
определённым образом связанных между собой, то интуитивно понятно, что для
достаточно подробного описания такого документа метаданные также будут иметь
сложную структуру. Поэтому одна из задач создания метаданных -- разработка
модели описания метаданных, т.е. выработка общего формального подхода, логики
описания объектов, их свойств и связей между объектами.
Не углубляясь в историю, скажем, что на сегодняшний день наиболее
перспективной и общеупотребительной моделью описания метаданных является система
RDF
(Resource Description Framework), созданная международной организацией W3C
(World Wide Web Consortium) при участии представителей различных заинтересованных
организаций (см. Resource Description Framework (RDF) Model and Syntax Specification
).
Набор элементов
Однако модель - это только скелет описания. Для того, чтобы практически
описать хотя бы самые простые атрибуты документа (Название, Автор, Ключевые
слова и т.д.), нужно дать этим атрибутам названия, которые потом будут
использоваться во всём мире. В противном случае один автор напишет "Название:
Метаданные для чайников", другой: "Заголовок: Метаданные для чайников", а третий:
"Title: Метаданные для чайников" - и очевидно, что мы не получим единого подхода к
организации эффективного поиска информации.
Выбор системы метаданных и, соответственно, класс задач, решаемых на
основе этой системы, определяется функциональностью ЭБ, для которой эта система
метаданных создается. В настоящее время наиболее распространённой схемой
метаданных для описания онлайнового документа является набор, создаваемый уже в
течение нескольких лет международной группой "The Dublin Core initiative
". Этот
набор называется, соответственно, "Dublin Core Metadata Elements" (или "Дублинское
ядро" по названию города Дублин в штате Огайо (США), где расположена штаб-
квартира OCLC и где состоялась первая встреча группы) и состоит из 15 элементов
(см. RFC2413, Dublin Core Metadata for Resource Discovery
). Областью применения
этой системы метаданных, по замыслу, должен стать весь Интернет. Очевидно, что
при такой сверхуниверсальной области применения система метаданных должна
обладать максимальной простотой. При опросе специалистов различных стран,
присутствовавших в декабре 2000 г. в Лондоне на очередной выставке Online
Information, в качестве наиболее перспективного стандарта метаданных для описания
электронных ресурсов представители США, Англии, Франции, Германии, Японии, не
сговариваясь, называли именно Дублинское ядро. Известно, что уже ряд
национальных систем объявили о принятии Дублинского ядра в качестве
национального стандарта (Австралия, Швеция).
Базовыми элементами набора метаданных Дублинского ядра являются (все
элементы необязательны и могут повторяться):
28