Н. А. Максимов, Д. П. Синча
Московский авиационный институт (государственный технический университет)
МЕТОДЫ ХРАНЕНИЯ И АЛГОРИТМЫ ПОИСКА ИНФОРМАЦИИ
В ВИЗУАЛЬНЫХ БАЗАХ ДАННЫХ
Обычно аудиовизуальная информация предназначена для непосред-
ственного восприятия человеком. Однако увеличивается число и таких си-
туаций, когда эта информация создается, передается, извлекается и повтор-
но используется вычислительными системами: при распознавании изобра-
жений (видеонаблюдение, интеллектуальное зрение, скоростные видеока-
меры и т.д.), преобразовании (речи в текст, изображения в речь, речи в
изображение и т.д.) и извлечении информации (быстрый и эффективный
поиск различного типа мультимедийных документов, представляющих ин-
терес для пользователя). Также может быть выполнено автоматическое пе-
рекодирование строки символов в звуковую информацию или осуществлен
поиск в потоке аудио- или видеоданных.
Растет количество аудиовизуальной информации, которая может быть
представлена в самых различных медиаформатах: неподвижные изобра-
жения, графика, ЗD-модели, аудио, речь, видео. Тенденция очевидна: в
последующие несколько лет пользователи столкнутся с огромным коли-
чеством контентов (смысловое содержание аудиовизуальных данных) из
множественных источников. Несмотря на то, что для пользователей эти
источники становятся все более доступными, из-за их объема существен-
но усложняется эффективная идентификация и управление. Между тем
ценность получаемой информации часто зависит от того, насколько про-
сто ее найти, извлечь, получить доступ или отфильтровать. Исходя из того,
что аудиовизуальные источники будут играть в перспективе все большую
роль в нашей жизни, возрастет необходимость обрабатывать такие дан-
ные, хранить их в виде баз данных медиаинформации и производить поиск
необходимой информации в них.
В данной работе разрабатываются принципы хранения визуальной ин-
формации, которые обеспечивают возможность ее дальнейшего поиска в
визуальных БД, даже при некотором искажении исходной информации.
Под визуальной информацией здесь понимаются неподвижные изображе-
ния (8-битные полутоновые 2D растровые изображения). Это могут быть
как художественные полотна, переведенные в цифровой вид, фотографии,
географические карты, снимки со спутника, так и отдельные кадры видео-
ряда.
232