консолидируют важные записи для долговременного хранения. Один из подходов состоит в
сохранении копий финансовых и юридических записей в уменьшенном виде (микрофиши или
микрофильмы), поскольку эти носители для архивных целей исключительно долговечны.
Поскольку все типы носителей для цифровой информации имеют короткий срок службы, ЭБ
должны планировать периодическое обновление своих коллекций. Каждые несколько лет
данные должны переноситься на новые носители. С финансовой точки зрения это не пустая
трата денег. Следующие несколько десятилетий компьютерное оборудование будет падать в
цене с одновременным увеличением возможностей и производительности. Оборудование,
которое понадобиться для переноса сегодняшних данных через десять лет будет стоить лишь
несколько процентов от сегодняшней цены, а роботы помогут минимизировать трудозатраты.
Как это часто бывает в случае ЭБ, вопрос скорее организационный: будут ли библиотеки и
издательства систематически выполнять эти работы?
Сохранение содержания путем преобразования
(Preserving Content by Migration)
Даже если допустить, что биты систематически обновляются при переносе на другой
носитель и техническая потребность в сохранении исходных данных установлена, сама
проблема еще только начинается. Цифровая информация бесполезна без сведений о форматах,
протоколах и метаданных. Древние манускрипты могут быть прочитаны, поскольку язык и
способ письма меняется медленно. Для интерпретации старых документов требуется большой
опыт, но подобный опыт сохраняется в поколениях, так что и студент может расшифровать
старые материалы.
Компьютерные форматы меняются постоянно. Файл, записанный в формате десятилетней
давности, уже может быть трудно прочесть. В мире уже нет компьютера, который мог бы
выполнить программы для компьютеров, которые были весьма распространены лишь совсем
недавно. Некоторые форматы очень просты. Например, если в будущем археолог столкнется с
файлом с ASCII-текстом, даже если все знания об этом формате будут утрачены, код настолько
прост, что текст, вероятно, будет прочтен. Но ASCII - скорее исключение. Другие форматы
весьма сложны. Трудно допустить, чтобы кто-то смог расшифровать MPEG-архивированный
файл без информации о математическом алгоритме или понять большую компьютерную
программу лишь по машинному коду.
Таким образом, кроме хранения исходных данных, цифровые архивы должны хранить
информацию о методах получения данных, о типе, структуре и формате. Если для
интерпретации данных необходима компьютерная программа, то сохранятся должна эта
программа и устройство для ее выполнения. Либо эти данные должны мигрировать в другую
форму. В ближней перспективе, для этих целей можно хранить старые компьютерные системы,
но компьютеры весьма недолговечны. Рано или поздно он сломается, запасные части будут
недоступны - и любые программы, которые исполнялись на таком компьютере, будут
бесполезны. Поэтому преобразование содержания представляется необходимым.
Преобразование является стандартной технологией при обработке данных уже десятилетия.
Пенсионные фонды, например, хранят записи о финансовых транзакциях многие годы.
Администрация социального обеспечения (Social Security Administration) США хранит записи
об уплате налогов всего работоспособного населения в течение всего периода их работы. Эти
записи находятся в компьютерах, но сами компьютерные системы периодически заменяются.
Устанавливаются новые компьютеры, обновляется программное обеспечение. После этих
изменений данные мигрируют с компьютера на компьютера, из базы данных в базу данных.
Базовый принцип преобразования состоит в том, что меняться могут форматы и структура, но
семантика содержимого должна сохраняться.
Другой иногда предлагаемый метод - эмуляция. Идея состоит в создании полной имитации
деталей компьютерной среды (операционной системы), необходимой для исполнения
программы. В результате, в любой момент времени в будущем может быть построен эмулятор,
который будет вести себя точно так же, как и исходный компьютер. С точки зрения некоторых
специальных нюансов, это неоднозначное предположение. Например, возможно создать такую