
8.2.3. Поиск по обратной связи
Поиск по обратной связи реализуется, например, через последова-
тельность взаимосвязанных этапов:
-
отбор и выделение множества релевантных документов;
-
построение ранжированного словника релевантных документов
и предоставление словника пользователю;
-
выбор терминов словника для формирования информационного
пространства;
-
разбиение построенного информационного пространства на
кластеры и предоставление пользователю возможности для просмотра
документов каждого отдельного кластера.
Особенностью реализации является возможность использования
результатов, полученных на каждом этапе, для дальнейшего изменения
стратегии поиска (так, например, термины, отобранные при просмотре
словника релевантных документов, могут быть просто использованы для
расширения запроса и проведения поиска по логическому выражению).
Рассмотрим порядок выполнения этапов на следующем примере.
Пусть исходное предложение запроса на поиск по логическому
выражению в БД «Информатика» было следующим:
KW : ‘Поисковые стратегии’
При просмотре текстов документов-результатов поиска все из них
были отмечены пользователем как релевантные. Тогда будет построен и
выведен пользователю в ранжированном представлении следующий
словник (для ранжирования использован интегральный коэффициент
62
):
2 ВЕКТОРНЫЕ МОДЕЛИ 1,037520473
5 ИНФОРМАЦИЯ О РАБОЧИХ МЕСТАХ 0,626009986
5 ПРЕДСТАВЛЕНИЕ ДОКУМЕНТОВ 0,602280990
7 РЕШЕНИЕ ПРОБЛЕМ 0,492237706
8 АССОЦИАТИВНЫЙ ПОИСК 0,454205158
23 РАЗРАБОТКА 0,440147604
12 КЛАСТЕРИЗАЦИЯ 0,329185167
15 ПОИСК ИНФОРМАЦИИ 0,310164008
18 ЗАВИСИМОСТЬ 0,256065252
24 ПОИСКОВЫЕ СРЕДСТВА 0,232370300
23 ПРОИЗВОДИТЕЛЬНОСТЬ 0,219695378
59 ОПРЕДЕЛЕНИЯ 0,120537948
59 ЭКСПЛУАТАЦИЯ 0,120537948
102 ОБЕСПЕЧЕНИЕ ДОСТУПА 0,092969592
88 СРЕДСТВА 0,092775247
90 ПОНЯТИЯ 0,091405883
255 АИПС 0,091326155
134 СВОДНЫЕ КАТАЛОГИ 0,077708893
169 ТИПЫ 0,059747985
241 ТЕНДЕНЦИИ РАЗВИТИЯ 0,052260958
261 ИНТЕРАКТИВНЫЙ ДОСТУП 0,049447866
231 РЕЗУЛЬТАТЫ 0,048036882
285 ИНФОРМАЦИОННЫЕ ЗАПРОСЫ 0,046496765
62
Голицына О.Л. Моделирование и разработка средств и технологий поиска документальной инфор-
мации - диссертация на соискание ученой степени кандидата технических наук. – М.: РГГУ, 2004