Данные в таком хранилище характеризуются следующими свойствами:
· предметная ориентация - данные организованы согласно предмету, а
не приложению (в соответствии со способом их применения);
· Интегрированность - данные согласуются с определенной системой
наименований, хотя могут принадлежать различным источникам и их формы
предстамения могут не совпадать;
· упорядоченность во времени - данные согласуются во времени для
использования в сравнениях, трендах и прогнозах;
· неизменяемость и целостность - данные не обновляются и не
изменяются, а только перезагружаются и считываются, поддерживая
концепцию «одного правдивого источника».
· большой объем и сложные взаимосвязи данных.
К основным категориям данных, которые располагаются в хранилище,
относятся: метаданные, описывающие способы извлечения информации из
различных источников, методы их преобразования из различных структур и
форматов и доставки в хранилище; фактические данные (архивы),
отражающие состояние предметной области и конкретные моменты времени;
суммарные данные, полученные на основе проведенных аналитических
расчетов.
В информационных хранилищах используются статистические
технологии, генерирующие информацию об информации; процедуры
суммирования; методы обработки электронных документов, аудио-,
видеоинформации, графов и географических карт.
Для уменьшения размера информационного хранилища до минимума
при сохранении максимального количества информации применяются
эффективные методы сжатия данных.
Для преобразования данных из хранилища в предметно-
ориентированную форму требуются языки запросов нового поколения.
Руководителям организации данные доступны посредством SQL-запросов,
инструментов создания интерактивных отчетов на экране, более развитых
систем поддержки принятия решений, многомерного просмотра данных
посредством гипертекстовой технологии.
Для хранения данных обычно используются выделенные серверы, или
кластеры серверов (группа накопителей, видеоустройств с общим
контроллером).
Создание информационного хранилища данных требует решения ряда
организационных вопросов, а также удовлетворения следующих требований
к аппаратному и программному обеспечению.
Скорость загрузки. В хранилищах необходимо обеспечить
периодическую загрузку новых порций данных, укладывающихся в
достаточно узкий временной интервал. Требуемая производительность
процесса загрузки не должна накладывать ограничения на размер хранилища.
Технология загрузки. Загрузка новых данных в хранилище включает
преобразование данных, фильтрацию, переформатирование, проверку
целостности, организацию физического хранения, индексирование и