
118
(KW:массивы ИЛИ KW:'базы данных') И (KW:формирование ИЛИ
KW:структура)
Поиск по логическому выражению в результате дал 96 докумен-
тов, 33 из которых оказались релевантными (те же, что и при поиске по
совпадению терминов с пороговым значением 2). При том же значении
полноты, что и в случае использования предыдущей стратегии, был по-
лучен лучший показатель точности.
В приведенных примерах была использована нормализованная
лексика, в точности совпадающая с лексикой названия рубрики. Улуч-
шать показатели эффективности в данном случае можно, только путем
модификации логического выражения.
Рассмотрим далее результаты обеих стратегий в случае использо-
вания аппарата маскирования терминов запроса.
Предложение запроса для стратегии поиска по совпадению терми-
нов имеет следующий вид:
KW:(массив* и баз*данн* и формирован* и структур*)
Поиск по совпадению терминов с пороговым значением 2 в дан-
ном случае дает в результате 150 документов (55 релевантных), а с поро-
говым значением 1 – 5735 документов (806 релевантных).
Использование маскирования в стратегии поиска по логическому
выражению привело к следующему результату: всего найдено 140 доку-
ментов, из них 55 релевантных. Из табл.4.2 видно, что маскирование
терминов повышает показатели и полноты, и точности.
Применение стратегий, основанных на вводе терминов поискового
запроса, во многом зависит от полноты и точности отдельных терминов
в рамках информационного массива и не может вывести пользователя за
пределы используемой в запросе лексики. Рассмотрим применение стра-
тегий, основанных на поиске по некоторым формальным признакам до-
кументов, «похожих» на уже найденные релевантные.
Использование механизма поиска документов-аналогов. При про-
смотре релевантных документов функция поиска документов-аналогов
может вывести пользователя на новую лексику – показать множество
терминов, которое можно использовать для поиска новых релевантных
документов. Например, инициировав поиск аналогов для документа,
представленного на рис. 4
.6, найдем релевантные документы, которые
не могли быть найдены при использовании вербальных стратегий, т.к. не
содержат терминов исходного запроса. Тем самым, механизмы поиска
«похожих» документов позволяют не только увеличить показатель пол-
ноты поиска, но и выводят пользователя на новый неиспользованный в
запросах пласт лексики предметной области.