Программа для внедрения текстового OCR слоя в djvu книги. Текстовый
слой позволяет использовать поиск по документу и копировать текст
из djvu в doc (word) или txt.
Djvu OCR работает совместно с программой FineReader 7/8/9 версий, предназначенной для распознавания текста. Оцифровка происходит в три этапа:
• Djvu OCR конвертирует документ в формат tiff
• FineReader распознает текст в полученных изображениях
• Djvu OCR обрабатывает рабочий проект Finereader, извлекает необходимую информацию и интегрирует текстовый слой в djvu.
Кроме интеграции программа может извлекать уже существующий текстовый слой в djvu файла (режим Извлечь OCR Слой). Можно указать диапазон страниц для извлечения текста или обработать весь документ. Выходной формат: txt, html.
Программа не требует установки. В архиве 4 исполняемых файла:
DjvuOCR — Win32 GUI версия.
FRFGrab — консольная версия.
Djvused — стандартная утилита пакета djvulibre.
cvthtml2 — конвертация OCR слоя в HTML (UTF8).
Продвинутые пользователи могут использовать консольную версию программы (подробное описание команд есть в файле справки), остальным же достаточно запустить DjvuOCR.exe, который имеет привычный интерфейс.
Djvu OCR работает совместно с программой FineReader 7/8/9 версий, предназначенной для распознавания текста. Оцифровка происходит в три этапа:
• Djvu OCR конвертирует документ в формат tiff
• FineReader распознает текст в полученных изображениях
• Djvu OCR обрабатывает рабочий проект Finereader, извлекает необходимую информацию и интегрирует текстовый слой в djvu.
Кроме интеграции программа может извлекать уже существующий текстовый слой в djvu файла (режим Извлечь OCR Слой). Можно указать диапазон страниц для извлечения текста или обработать весь документ. Выходной формат: txt, html.
Программа не требует установки. В архиве 4 исполняемых файла:
DjvuOCR — Win32 GUI версия.
FRFGrab — консольная версия.
Djvused — стандартная утилита пакета djvulibre.
cvthtml2 — конвертация OCR слоя в HTML (UTF8).
Продвинутые пользователи могут использовать консольную версию программы (подробное описание команд есть в файле справки), остальным же достаточно запустить DjvuOCR.exe, который имеет привычный интерфейс.