
IV Международная научно-техническая конференция
190
наращивании значения PageRank страниц сайта. Фермы ссылок часто не содержат никакого
полезного контента (содержания) и создаются автоматически специальными программами.
5. Пакетная покупка ссылок через биржи ссылок.
Способ заключается в массовой покупке ссылок через ссылочных брокеров.
Наибольшее распространение в России получили такие брокеры, как Sape.ru, Xap.ru,
MainLink.ru, LinkFeed.ru, SetLinks.ru и т.д. Покупка чаще всего осуществляется в
автоматическом режиме – пользователь выбирает параметры сайтов, на которых хотел бы
разместить ссылки, и указывает цену размещения за месяц. Цена размещения ссылки часто
бывает номинальной – от 0.01$ в месяц. Таким образом, за 10$ пользователь может
приобрести до 1000 ссылок. Несмотря на то, что ссылочные брокеры позиционируют себя
как рекламные менеджеры, речь на самом деле идет именно о ссылочном спаме, так как
ссылки размещаются в самых незаметных местах страниц (чаще всего в самом низу) и
пользователь их даже не замечает. Естественно, такие ссылки назвать «рекламными» нельзя
[12].
Пакетная покупка ссылок через ссылочных (рекламных) брокеров представляет в
настоящее время серьезнейшую проблему. Ссылочные брокеры могут размещать ссылки на
миллионах страниц. Например, самая популярная система купли-продажи ссылок – Sape.ru
имеет возможность размещать ссылки на более чем 200 миллионах страниц. В 2008 году это
число составляло 35 миллионов страниц. Рост аудитории в 6 раз в течение двух лет
свидетельствует о повышающейся популярности этой системы. Среди сайтов, размещающих
у себя ссылки через ссылочных брокеров, имеется множество популярных и авторитетных
сайтов. В отличие от раннее рассмотренных способов, ссылки размещаются на обычных
страницах, составляющих основное содержание сайта.
Данный вариант размещения ссылочного спама получил в настоящее время большое
распространение.
ПУТИ ОБНАРУЖЕНИЯ ССЫЛОЧНОГО СПАМА
Основным средством по борьбе со ссылочным спамом является его обнаружение с
целью нейтрализации действия на поисковые системы.
Обнаружением ссылочного спама, размещаемого в каталогах, гостевых книгах и
форумах, занимаются практически все поисковые системы. По этой причине создано
достаточно большое количество решений, например, алгоритмы SpamRank, TrustRank, Anti-
TrustRank, HostRank и т.д.
Алгоритм SpamRank [1] основан на понятии персонализированного PageRank и
обнаруживает страницы с незаслуженным высоким значением PageRank без использования
любого вида белых или черных списков или других средств вмешательства человека.
Принцип алгоритма TrustRank [4] строится на том, что «хорошие» страницы обычно
ссылаются на «хорошие» страницы и редко используют ссылки для спама. Сначала
выбирается набор «хороших» страниц и им назначается высокий вес. Далее используется
подход, аналогичный PageRank: вес разделяется на исходящие ссылки к другим страницам.
Наконец, после конвергенции, страницы с высоким весом принимаются за хорошие
страницы. Авторы считают, что использование алгоритма TrustRank дает более качественные
результаты, чем PageRank.
Алгоритм Anti-TrustRank [7] основан на ручном отборе страниц со спамом и без него.
Дальнейший анализ структуры вэб-графа, построенного на основе ссылочных структур,
позволяет выявить страницы, использующие спам. Алгоритм показывает высокую точность
обнаружения спама, в том числе, для страниц с высоким PageRank.
В работе [2] предлагается алгоритм HostRank (PageRank, вычисленный по графу
хостов), который более гибок по отношению к ссылочному спаму. Алгоритм позволяет
сократить число сомнительных сайтов в результатах поиска, что достигается уменьшением
веса, получаемого сайтами от ссылочного спама.