
В информационном поиске стандартные оценки,
определяющие долю выданных релевантных докумен-
тов, а также долю релевантных документов в выдаче,
не всегда достаточны для оценки эффективности
поисковой системы. Дело в том, что эти показатели
не учитывают усилий, затрачиваемых на поиск доку-
ментов, в то время как в различных ИПС эти затра-
ты существенно различны. Поэтому полезно ввести
коэффициент трудозатрат потребителя, определяемый
следующим образом:
Чтобы обеспечить достаточную степень сравнимости
различных систем, нужно значение коэффициента h
оставлять фиксированным в пределах данного про-
цесса оценки. Другие показатели эффективности
информационного поиска см. в ([22], гл. 4, п. 8).
В заключение настоящего пункта опишем матема-
тическую модель систем избирательного распределе-
ния информации (ИРИ). Они призваны решить проб-
лему избирательности и оперативности поиска и
применяются в сравнительно небольших массивах
предварительно подобранных документов, причем
запросы, или профили интересов потребителей, более
или менее длительное время сохраняются в системе.
Идея индивидуального обслуживания, при котором
отдельные потребители или группы потребителей
оповещаются о наличии потенциально полезной для
них литературы, была формализована X. Луном в
фирме ИБМ. При этом интересы потребителей опи-
сываются посредством слов или словосочетаний
(т. е. создается профиль интересов потребителей).
Если документы при вводе их в фонд описываются
на стадии индексирования аналогичным образом, то
полученные таким способом ПОД можно сопоставить
с профилями интересов потребителей. Когда имеет
место совпадение профилей в каких-то заранее уста-
новленных пределах, потребитель извещается о нали-
чии документа, предположительно релевантного его
интересам. В системе ИРИ, в отличие от ИПС рет-
роспективного поиска, мы индексируем не документы
и запросы, а документы и интересы потребителей.
При этом весьма важно наличие определенного
235