Для перехода к нужному разделу тематического каталога можно вос-
пользоваться встроенной системой автоматического поиска по ключевым
словам. Для этого в строке запроса вводится ключевое слово или сочетание
слов и щелкается кнопка Поиск; система сообщает, есть или нет соответст-
вующий раздел в ее каталоге, и, если он имеется, предлагает перейти в него
непосредственно, минуя промежуточные разделы.
Индексные системы – поисковые системы, которые строятся на иных
технологических принципах, чем тематические каталоги. Задача таких по-
исковых систем – найти максимальное количество документов в Интерне-
те, имеющих отношение к заданному пользователем вопросу, что может
быть достигнуто путем просмотра, анализа и учета (индексирования) со-
держания максимально возможного числа веб-страниц.
В отличие от тематических каталогов, индексные системы функциони-
руют в автоматическом режиме. Они состоят из двух базовых компонентов.
Первый компонент представляет собой программу-робот, задача которо-
го – переходить с сервера на сервер, отыскивая там новые или изменивши-
еся документы и скачивая их на главный компьютер системы. При этом ро-
бот, просматривая содержимое документа, находит новые ссылки как на
другие документы данного сервера, так и на внешние сайты. Программа са-
мостоятельно направляется по указанным ссылкам, находит новые доку-
менты и ссылки в них, а затем процесс повторяется, напоминая хорошо из-
вестный в библиографии «метод снежного кома». Выявленные документы
обрабатываются (индексируются) другим компонентом поисковой систе-
мы. При этом, как правило, учитывается все содержание страницы, вклю-
чая текст, иллюстрации, аудио- и видеофайлы и пр.
Индексации подвергаются все или специально отобранные слова в до-
кументе, что и позволяет использовать такие системы для детального поис-
ка информации даже по узкой тематике. Образуемые при этом гигантские
индексные файлы, хранящие информацию о том, какое слово, сколько раз,
в каком документе и на каком сервере употребляется, составляют базу дан-
ных, к которой обращаются пользователи, вводя в строку запроса сочета-
ния ключевых слов.
Результаты выводятся с помощью специального модуля, который про-
изводит ранжирование, исходя из местоположения термина в документе
(название, заголовок, основной текст), частоты его повторения, процент-
ного отношения к остальному тексту страницы, языка и формата докумен-
та, а также количества и авторитетности внешних ссылок на данную стра-
ницу с других сайтов.
Из множества индексных систем выделяются наиболее признанные, по-
зволяющие выявлять максимум информации с высокой степенью полноты
и достоверности. К наиболее авторитетным поисковым системам (рис. 5.6)
в настоящее время относятся Google (www.google.com), а также AlltheWeb
(www.alltheweb.com) и Alta Vista (www.altavista.com). В каждой стране, как
Модуль 5. Основы работы с Интернетом и телекоммуникациями
374