языками разметки и протоколами, принятыми в Интернет. Это HTML или HTTP
метаданные — теги <meta>, определяемые соответственно спецификациями RFC 1866
и 2616. Но ввиду неудобства использования этих тегов (они не могут использоваться с
другими типами файлов и быстро становятся громоздкими) и с учетом массовой
миграции интернет-приложений на язык XML, все более широко используется шаблон
RDF как метод обмена метаданными на основе языка XML, разработанный
Консорциумом W3 в связке с системой метаданных Дублинского ядра.
Кто создает метаданные
До последнего времени библиотеки и библиотекари являлись основными
производителями метаданных для карточных и электронных каталогов и
индексаторами библиографических баз данных. Однако, в настоящее время,
теоретически, каждый может создать метаданные для любого цифрового объекта в
соответствии со своими потребностями и разместить их в сетевой среде, установив
ссылку на сам объект. В идеале, создатель или разработчик цифрового объекта
обладает самым глубоким знанием о нем (содержание, назначение, отношение к
другим документам и т. д.). Так, на различных сайтах имеются специальные шаблоны
для описания метаданных, которые запрашиваются у автора (иногда в обязательном
порядке). Эти метаданные могут автоматически размещаться в HTML-заголовках
документа, или загружаться в базы данных.
Примерами могут служить шаблоны Nordic Metadata
(http://www.ub.lu.se/metadata/DC_creator.html
), форма для предоставления метаданных
в рамках проекта “Немецкие диссертации он-лайн” (German Dissertations Online
Project) и форма для регистрации документов (электронных или неэлектронных) в
хранилище метаданных по образовательным материалам и учебным курсам
(http://dbs.schule.de/db/listen.html
) на сервере образовательных ресурсов Германии
(http://dbs.schule.de
).
В других случаях применяются специально разработанные механизмы
автоматического поиска информации, которые способны с высокой степенью
точности извлечь из HTML-файлов или форматированного текста имя автора,
названия связанных с ним организаций, дату или другие параметры и разместить эти
данные в индексе или создать набор метаданных для данного документа. Подобная
технология применяется в настоящее время на серверах препринтов и архивов, таких
как Математический сервер препринтов в Германии (Osnabruck — проект программы
e-Lib) (http://elib.uni-osnabruck.de/talks/dfg/kurzELib.html
) и ряде других. Несмотря на
то, что точность извлечения метаданных в отдельной области путем анализа текста до
сих пор остается под вопросом, методы кластеринга слов и другие методы анализа
текста продолжают усовершенствоваться и относятся к сфере исследований в области
электронных библиотек, которые повлияют на развитие метаданных в целом и их
значимость в будущем.
В случае, если соответствующие метаданные не предоставляются автором или
создателем лично, издатель вынужден нанимать опытных в этой области
специалистов для их создания. Это могут быть библиотекари или другие
информационные специалисты, ученые в данной области, или компании. Метаданные
могут быть добавлены непосредственно в документ, размещены в хранилище
метаданных, используемом для информационного поиска, или храниться в отдельном
файле. Таким образом, теоретически в одной сети могут находиться различные
наборы и формы представления метаданных для одного и того же документа.
33