
61
С точки зрения организации процедуры отбора этому соответствует
два способа соотнесения затребованного с имеющимся в информационном
массиве: 1) путем сопоставления запроса непосредственно с содержанием
объекта, выбранного для сравнения; 2) опосредованно, когда запрос со-
поставляется с образом, производным (вторичным) по отношению к само-
му объекту. С точки зрения представленного выше алгоритма разница ме-
жду этими способами состоит в том, объект какой природы будет выби-
раться в цикле для сравнения – непосредственное содержание или некото-
рый идентификатор, отражающий содержание отчасти или в целом. Неяв-
ным, но, с точки зрения реализации алгоритма поиска – основным факто-
ром здесь является форма (способ), определяющая порядок выборки: от
порядка расположения объектов в массиве (например, в том «естествен-
ном» порядке, в каком они поступали для хранения), или в «искусствен-
ном» порядке, соответствующем, например, классификации предметной
области. Но, поскольку и в том, и в другом случае мы имеем дело с перебо-
ром объектов, выбираемых из хранилища для сравнения, рациональность
построения процедуры поиска будет определяться длиной перебора, что в
свою очередь определяется как характеристиками хранимых объектов (в
нашем примере – размерами документов), так характером запросов (в на-
шем примере – поиском по предмету или по шифру хранения документов).
Соответственно, оптимизация процесса в первую очередь связывается с
возможностью сокращения времени перебора, то есть - длины выбираемой
последовательности.
В общем случае можно сказать, что технологии (алгоритмы) поиска
основываются на двух типах организации массива объектов поиска – пря-
мой и инвертированной. Для рассмотрения взаимосвязи алгоритма поиска
и организации массива здесь и далее используем знакомый всем пример
организации и поиска информации в традиционных библиотеках
20
.
В случае прямой организации массива документы размещаются в по-
следовательности, не связываемой с порядком какой-либо классификации
или алфавита, например, в порядке их поступления в хранилище. Но здесь
надо отметить, что определяющим в понятии «прямая организация» явля-
ется не характер размещения документов – единиц хранения, а размещение
содержания документов, которое представлено изначальной «естествен-
ной» последовательностью слов, образующих, в том числе, и контекст их
употребления. Поиск по предмету при такой организации для больших
массивов будет требовать достаточно много времени, так как для этого на-
до последовательно выбирать для сравнения с запросом все документы из
хранилища, поскольку, не обратившись к документу, мы не можем судить
о его содержании.
В инвертированном массиве документы могут быть, например, раз-
биты на подмножества, которые упорядочены в соответствии с некоторой
классификацией и, что особенно важно, обозначены идентификаторами,
20
Отметим, что выбор этого примера основывается не только на его «привычности» для человека, но
и на том, что с методологической и системной точек зрения применяемые в библиотеках подходы,
методы и технологии являются по существу универсальными и не зависящими от уровня автоматиза-
ции.