Тип изображения - серый (256 градаций), черно-белый или цветной. Ска-
нирование в сером цвете является наиболее оптимальным режимом. Чер-
но-белый тип изображения обеспечивает более высокую скорость скани-
рования, но может привести к ухудшению качества распознавания доку-
ментов среднего и низкого качества. Если необходимо сохранит содержа-
щиеся в документе цветные элементы (картинки, цветные буквы и цветной
фон), необходимо выбрать цветной тип изображения.
Разрешен
ие - для обычных текстов (размер шрифта 10 и более пунктов)
достаточно 300 dpi, для текстов, набранных мелким шрифтом (9 и менее
пунктов) необходимо разрешение 400-600 dpi.
Яркость - в большинстве случаев подходит среднее значение яркости -
50%.
Особенности открытия PDF-файлов. Создатель PDF-файла может ограни-
чить доступ к своему файлу, например, защитить его паролем, установить
запрет на открытие файла или извлечение из него текста и графики. При
открытии подобных файлов ABBYY FineRead
er будет запрашивать пароль,
чтобы обеспечить защиту авторских прав создателя файла.
Следующим этапом выполнения работ является анализ макета стра-
ницы
Прежде, чем приступить к распознаванию, программа должна знать, какие
участки изображения надо распознавать. Для этого выделяются блоки с
текстом, картинки и таблицы. Анализ макета страницы может проводиться
как автоматически, так и вручную с использованием инструментов панели
изображения. В большинстве случаев ABBYY FineReader сам успешно
справляется с анализом сложных страниц. Автоматический анализ также
производится по нажатию кнопки
2-Распознать одновременно с распозна-
ванием текста.
Типы блоков:
Блоки - это заключенные в рамку участки изображения. Блоки выделяют
для того, чтобы указать системе, какие участки отсканированной страницы
надо распознавать и в каком порядке. Также по ним воспроизводится ис-
ходное оформление страницы. Блоки разных типов имеют различные цвета
рамок.
Текст - блок используется для обозначения текста. Он должен содержать
только одноколоночный текст. Если внутри текста содержатся картинки,
они выделяются в отдельные блоки.
Таблица - этот блок используется для обозначения таблиц или текста,
имеющего табличную структуру.
Картинка - этот блок используется для обозначения картинок. Он может
содержать картинку или любую другую часть текста, которая должна со-
храниться в качестве картинки.
194