115
5. ИНФОРМАЦИОННЫЕ ПОТОКИ
И ВОПРОСЫ ЖИВУЧЕСТИ
5.1. Информационные потоки
Информационные системы как сетевые структуры в информа-
ционном пространстве состоят из отдельных элементов, образующих
в динамике своей эволюции (появление, развитие, модификация,
уничтожение) информационные потоки. Следовательно, живучесть
информационных систем напрямую зависит от свойств информацион-
ных потоков.
Для исследования современных информационных потоков в
Интернете, т.е. потоков сообщений, которые публикуются на страни-
цах веб-сайтов, в социальных сетях, блогах, и тому подобное, должен
применяться принципиально новый инструментарий, потому что клас-
сические методы обобщения информационных массивов (классифи-
кации, фазового укрупнения, кластерного анализа и тому подобное) не
всегда способны адекватно отражать состояние динамической состав-
ляющей информационного пространства. В этом случае речь идет не
столько об анализе документальных массивов фиксированных разме-
ров, пусть даже очень больших, сколько об обобщении динамического
потока гипертекстовых данных.
Конечно, большая часть информации, которая представлена в
Интернете, находит своего потребителя. Однако если рассматривать
всю совокупность сетевых публикаций как определенную общность
по отношению к конкретному пользователю (или группе пользовате-
лей), то можно увидеть ряд проблем, связанных с полнотой, релевант-
ностью и оперативностью получения данных. Поиск, фильтрация, сбор
информации в Интернете требуют достаточной квалификации персона-
ла и, к сожалению, при этом не могут учитываться все особенности ин-
формационной структуры сети и представления в ней данных. Это, в
свою очередь, ведет к тому, что единичные выборки информации из
веб-пространства не могут считаться репрезентативными.
При этом информационный поток, который «потребляется» кон-
кретным пользователем, носит, как правило, выраженную предметную
направленность, которая характеризуется областью его интересов.
Поиск и обработка информации в ручном режиме — достаточно тру-
доемкий, а главное, длительный процесс, который чаще всего не дает