OS - Windows. Freeware. Portable
Модифицированная версия 2 DjvuOCR 2.4 beta RC4 - полностью понимает
русские имена файлов + высокая скорость обработки. Есть указания по
работе с Finereader 9 (проверенные) - см. NBell-mod.txt.
Программа не требует установки. Распакуйте архив. Запусктите
DjvuOCR.exe. Программа имеет хорошую справку на русском языке (при
переключении языка программы на "Русский").
Программа предназначена для извлечения/внедрения текстового
OCR-слоя в djvu. Текстовый слой позволяет использовать поиск по
документу и копировать текст из djvu в doc (MS Word) или любую
другую программу.
DjvuOCR работает совместно с OCR-программой FineReader 7/8/9
версий. Текстовый слой создается в готовом djvu в три этапа:
- DjvuOCR конвертирует djvu в формат tiff (кроме tif поддерживается bmp, jpeg, pnm, pgm, pbm, ps, pict)
- FineReader распознает текст в полученных изображениях tiff
- Djvu OCR обрабатывает рабочий проект Finereader, извлекает необходимую информацию и интегрирует текстовый слой в djvu. Кроме интеграции программа может извлекать уже существующий текстовый слой из djvu файла (режим Извлечь OCR Слой). Можно указать диапазон страниц для извлечения текста или обработать весь документ. Выходной формат: html, djvused скрипт (utf8 txt). Продвинутые пользователи могут использовать консольную версию программы (подробное описание команд есть в файле справки), остальным же достаточно запустить DjvuOCR.exe, который имеет привычный интерфейс.
- DjvuOCR конвертирует djvu в формат tiff (кроме tif поддерживается bmp, jpeg, pnm, pgm, pbm, ps, pict)
- FineReader распознает текст в полученных изображениях tiff
- Djvu OCR обрабатывает рабочий проект Finereader, извлекает необходимую информацию и интегрирует текстовый слой в djvu. Кроме интеграции программа может извлекать уже существующий текстовый слой из djvu файла (режим Извлечь OCR Слой). Можно указать диапазон страниц для извлечения текста или обработать весь документ. Выходной формат: html, djvused скрипт (utf8 txt). Продвинутые пользователи могут использовать консольную версию программы (подробное описание команд есть в файле справки), остальным же достаточно запустить DjvuOCR.exe, который имеет привычный интерфейс.