Перед тем как запускать распознавание, страницу надо разбить на
блоки. Программа работает эффективнее, если выделены участки с
текстом. В документе могут находиться рисунки, которые, естественно
«распознавать» не нужно. К тому же различные участки текста могут
иметь разный формат и разный язык. FineReader может выполнить
разбиение на блоки самостоятельно, после того как вы нажм
ете кнопку
Сегментировать открытую страницу. Но блоки можно создавать и
вручную. Для этого надо выделить часть текста мышью так, как
выделяют объекты в приложениях Windows: нажать левую кнопку и
обвести участок текста прямоугольной рамкой. Блок можно и удалить.
Для этого его надо выделить мышью и нажать клавишу Del. Для того
чтобы было удобнее работать с блоками, не забывайте изменять
масштаб: можно исп
ользовать режим уменьшения 50 % или 25 %.
Для работы с блоками можно использовать контекстное меню.
Например, важно определить для каждого блока его тип: текст, таблица,
картинка, штрих-код. Разумеется, если документ заполнен однородным
текстом, то выделять блоки не нужно.
Для всей страницы надо выбрать из списков на панели
инструментов язык и тип шрифта. Стандартных типов шрифта два:
«матричный принтер» и «пишущая машинка». Дело, конечно, не в том,
на чем отпечатан документ, а в том, как выглядят буквы. На матричном
принтере можно отпечатать текст так, что он будет иметь вид
машинописного. Если у вас есть сомнения, всегда можно
поэкспериментировать, благо распознавание проводится достаточно
быстро. Но по умолчанию программа выбирает автоматическое
определение типа шрифта, так что, возможно, эту задачу следует
оставить для нее.
Теперь можно включить распознавание большой кнопкой
Распознать открытую страницу. Проверьте результат. Если он
неудовлетворительный, значит надо изменить параметры и попробовать
еще раз.
Практика показывает, что лучше распознаются буквы в
полужирном начертании, нежели тонкие. Кроме того, более крупные