
Б.И.Рабинович
223
рия диаграмм. По этой тематике проходят международные конферен-
ции и публикуются спецвыпуски журналов [Andersen, 2000],
[Hegarty, 2002], [Blackwell, 2001]. Далее представлен краткий анализ
тех работ первых двух конференций по теории диаграмм, проходивших
в 2000 и 2002 годах, в которых диаграммы рассматриваются и анализи-
руются как знаковые формы представления знаний. При таком подходе
к анализу диаграмм и таблиц,
которые рассматриваются как частный
случай диаграмм, можно наблюдать формирование трёх основных на-
правлений в теории диаграмм:
1) исследование роли диаграмм в среде социальных коммуникаций;
2) распознавание диаграмм при анализе изображений страниц пол-
нотекстовых документов;
3) индексирование и поиск диаграмм в базах данных и электрон-
ных библиотеках с учётом сочетания вербальной и
образной информа-
ционных модальностей, которые им свойственны.
Подробнее остановимся на распознавании диаграмм при анализе
изображений страниц документов. Этот процесс является ключевым
этапом процесса преобразования документов из бумажной формы в
электронную. Важно отметить, что в виде изображений, формул и диа-
грамм могут быть представлены те концепты, описание которых отсут-
ствует в
вербальных компонентах документа. Процесс преобразования
документов включает в себя распознавание структуры документа, рас-
познавание линейного текста и кодирование невербальных компонен-
тов, включая диаграммы. Ниже приводится краткий обзор ряда под-
ходов к распознаванию диаграмм при анализе изображений страниц
документов в соответствии с работой [Blostein, 2000].
Проблема обработки диаграмм в процессе преобразования докумен-
тов из
бумажной формы в электронную привлекает внимание специали-
стов уже в течение десятков лет. Главными проблемами в распознава-
нии диаграмм являются: большое разнообразие классов диаграмм и
размытость границ классов, подклассов и более детальных уровней
классификации; отсутствие средств описания синтаксиса и семантики
диаграмм; необходимость обработки графических искажений.
Самое сложное заключается в том,
что даже самый верхний уро-
вень классификации диаграмм является весьма условным, так как
зависит от построения той или иной системы образных знаков.
В настоящее время иногда используется типология диаграмм на
основе предметных областей их использования, например, различаются
инженерные, математические, музыкальные, химические и экономиче-
ские диаграммы. Такой подход предложено называть предметной типо
-