
Рассматривая поиск как итеративный процесс, методы сокращения
пространства перебора (просматриваемого подмножества) образуют по
существу методологическую основу стратегии поиска и могут быть раз-
делены на следующие классы:
− методы поиска в одном пространстве (обычно, тематическом);
− методы поиска в иерархически упорядоченном пространстве;
− методы поиска в альтернативных пространствах;
− методы поиска в динамическом (изменяющемся в процессе по-
иска
53
) пространстве.
Для случая документальных ретроспективных БД наиболее акту-
альными являются два первых случая, где в свою очередь можно выде-
лить следующие подклассы:
− поиск методом уточнения / расширения области;
− поиск с использованием абстрактных пространств (динамически
выделяемых в соответствии с некоторым фиксированным набором при-
знаков);
− поиск с использованием метапространства (динамическое опре-
деление набора признаков для выделения подпространств), т.е. с пере-
определением метода поиска.
Учитывая опосредованность процесса извлечения информации из
БД, можно сказать, что практически всегда процесс выполняется в два
этапа (что соответствует и числу сторон - участников процесса). Первый
этап - автоматизированный отбор документов по формальному крите-
рию, в той или иной степени полно и точно соответствующих информа-
ционной потребности (предпочтительно более полно, хотя и менее точ-
но), и второй - "ручной" отбор с непосредственным просмотром.
К методам поиска необходимо относить все функциональные ре-
шения - от методов сопоставления ПОЗов и отбора документов по неко-
торому критерию смыслового соответствия (КСС) до методов упорядо-
чивания документов в выдаче, включая использование результатов по-
иска для реформулирования запроса.
Отбор документов по формальным критериям. Понятие мето-
да
54
отбора документов по существу сводится к понятию критерия смы-
53
Например, предлагаемый в [Borlund1997] метод основан на концепции "моделированной ситуации
рабочей задачи" и привлечения к оценке эффективности результатов поиска реальных конечных
пользователей. Метод базируется также на смешивании моделированных и реальных информацион-
ных потребностей и предполагает использование для оценки результатов как группы испытуемых,
так и индивидуальных планов экспертной группы. При оценках различается тематическая и ситуаци-
онная релевантность. Учитывается также динамический характер информационных потребностей,
которые у одного и того же потребителя могут со временем существенно изменяться.
54
Например, в [Ingwersen1998] анализируются четыре метода информационного поиска (булева ло-
гика с точным совпадением, расширенная булева логика, вероятностный поиск, поиск по кластерам),
рассматриваемые в связи с характером информационной потребности (уточнение - пользователю из-
вестны какие-то библиографические признаки нужного ему документа; тематический поиск - пользо-
ватель может сформулировать тематику своего запроса в адекватных понятиях и терминах; неопреде-