Компьютерные методы реализации экономических … решений
кластеризация – программные методы группировки доку-
ментов, основанные на применении лингвистических и математиче-
ских методов и не использующие предварительно определенные ка-
тегории. Кластеризация широко применяется при реферировании
больших документальных массивов, определении взаимосвязанных
групп документов, для упрощения визуализации информации, выяв-
ления дубликатов или близких по содержанию документов;
программный анализ связей – процесс, который позволяет
выявить дескрипторы (ключевые слова и фразы) в документе для
обеспечения навигации по этим дескрипторам. Используемая при
этом визуализация является ключевым звеном при представлении
схем неструктурированных текстовых документов. Она используется
как средство представления смыслового содержимого всего массива
документов, а также для реализации навигационного механизма, ко-
торый может применяться при исследовании документов и их клас-
сов, в том числе и в процессе информационного управления;
аннотирование текста, в котором используются два основ-
ных подхода: извлечение наиболее важных фрагментов (обычно
предложений) из исходного текста с последующей интеграцией их в
аннотацию и переформирование исходного текста на основе предва-
рительно разработанных тезаурусов, грамматик, онтологических
справочников и т.д.
Анализ текста может быть реализован несколькими методами:
по похожести, с использованием алгоритма нечеткого поис-
ка и алгоритма адаптивного распознавания образов [2.12, 2.13];
на основе ассоциаций, с использованием алгоритма поиска
по смыслу, что позволяет пользователю при составлении запроса не
знать ключевых слов, по которым должен быть произведен запрос, и
составлять запросы на естественном языке;
подражанием способам межличностным коммуникаций,
снимая возникающие неоднозначности за счет контекста. Так слово
«бочка», окруженное словами «солонина» и «капуста» будет воспри-
нято как емкость для хранения продуктов, а не как фигура высшего
пилотажа.
С любым из режимов анализа может быть использована динами-
ческая классификация, позволяющая пользователю комбинировать
данные, полученные по разным классификационным признакам.