Модели данных и технологии их обработки. Раздел дисциплины
«Информационные системы»: Учебное пособие. – Калининград: КГТУ,
2003, 115 с.
Рассмотрены основные модели данных, используемые в информационных системах в зависимости от их вида – структурированные или текстовые (неструктурированные), алгоритмы и технологии работы с данными. Приводятся методы индексирования текстов, методы простого и расширенного поиска в текстовой базе данных. Отражены основные модели структурированной организации хранения – списковая, сетевая, иерархическая. В пособие включены индивидуальные задания по излагаемым вопросам.
Оглавление.
ВВЕДЕНИЕ.
СТРУКТУРИРОВАННЫЕ ДАННЫЕ.
Линейные списки.
Способы доступа по первичному ключу.
Последовательное сканирование.
Блочный способ.
Двоичный способ.
Индексно-последовательный способ.
Индексно-произвольный способ.
Размещение элементов в упорядоченном списке.
Рандомизация.
Способы доступа по вторичному ключу.
Элементы, связанные в цепь.
Оптимизированные цепочки элементов.
Инвертированные списки.
Иерархические структуры.
Множественные ссылки на порожденные элементы.
Ссылки на подобные и порожденные элементы.
Кольцевые структуры.
Справочники.
Битовые отображения.
Сетевые структуры.
Множественные ссылки на порожденные элементы.
Кольцевые структуры.
Справочники.
Битовые отображения.
ТЕКСТОВЫЕ ДАННЫЕ.
Последовательные файлы.
Цепочечные файлы.
Инвертированные файлы.
Кластерные файлы.
Методы индексирования.
Позиционные методы назначения весов.
Статистические методы назначения весов.
Модель, использующая текстовую частоту.
Модель, учитывающая соотношение «сигнал-шум».
Модель, учитывающая распределение частоты термина.
Модель, учитывающая различительную силу термина.
Модификация модели, учитывающей различительную силу термина.
Модель, использующая динамическую оценку информативности.
Оптимизация размера справочника.
Кластеризация текстов.
Технология поиска релевантных текстов.
Поиск в инвертированных файлах.
Поиск при кластерной организации хранения.
Методы расширенного поиска.
Построение словаря синонимов.
Ассоциативное индексирование терминов.
Вероятностное индексирование терминов.
ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ.
ЛИТЕРАТУРА.
Оглавление.
Рассмотрены основные модели данных, используемые в информационных системах в зависимости от их вида – структурированные или текстовые (неструктурированные), алгоритмы и технологии работы с данными. Приводятся методы индексирования текстов, методы простого и расширенного поиска в текстовой базе данных. Отражены основные модели структурированной организации хранения – списковая, сетевая, иерархическая. В пособие включены индивидуальные задания по излагаемым вопросам.
Оглавление.
ВВЕДЕНИЕ.
СТРУКТУРИРОВАННЫЕ ДАННЫЕ.
Линейные списки.
Способы доступа по первичному ключу.
Последовательное сканирование.
Блочный способ.
Двоичный способ.
Индексно-последовательный способ.
Индексно-произвольный способ.
Размещение элементов в упорядоченном списке.
Рандомизация.
Способы доступа по вторичному ключу.
Элементы, связанные в цепь.
Оптимизированные цепочки элементов.
Инвертированные списки.
Иерархические структуры.
Множественные ссылки на порожденные элементы.
Ссылки на подобные и порожденные элементы.
Кольцевые структуры.
Справочники.
Битовые отображения.
Сетевые структуры.
Множественные ссылки на порожденные элементы.
Кольцевые структуры.
Справочники.
Битовые отображения.
ТЕКСТОВЫЕ ДАННЫЕ.
Последовательные файлы.
Цепочечные файлы.
Инвертированные файлы.
Кластерные файлы.
Методы индексирования.
Позиционные методы назначения весов.
Статистические методы назначения весов.
Модель, использующая текстовую частоту.
Модель, учитывающая соотношение «сигнал-шум».
Модель, учитывающая распределение частоты термина.
Модель, учитывающая различительную силу термина.
Модификация модели, учитывающей различительную силу термина.
Модель, использующая динамическую оценку информативности.
Оптимизация размера справочника.
Кластеризация текстов.
Технология поиска релевантных текстов.
Поиск в инвертированных файлах.
Поиск при кластерной организации хранения.
Методы расширенного поиска.
Построение словаря синонимов.
Ассоциативное индексирование терминов.
Вероятностное индексирование терминов.
ИНДИВИДУАЛЬНЫЕ ЗАДАНИЯ.
ЛИТЕРАТУРА.
Оглавление.