Страница:
• Окна Изображение и Текст
• Окно Крупный план
Глава 27.
Глава 28.
Глава 29.
Глава 30.
Глава 31.
• Окно Крупный план
Глава 27.
Клавиатурные эквиваленты для работы с окнами
Ctrl + Tab
Переключиться между активизированными окнами.
Alt +1
Активизировать окно Пакет.
Alt +2 Активизировать диалоговое окно Изображение.
Alt +3 Активизировать диалоговое окно Текст.
Переключиться между активизированными окнами.
Alt +1
Активизировать окно Пакет.
Alt +2 Активизировать диалоговое окно Изображение.
Alt +3 Активизировать диалоговое окно Текст.
Глава 28.
Сканирование TWAIN-интерфейс
В программе ABBYY FineReader работа со сканирующими устройствами осуществляется исключительно через интерфейс TWAIN вашей операционной системы.
Под TWAIN-интерфейсом понимается международный стандарт, который в свое время был принят для единого взаимодействия устройств ввода изображений с той или иной программой, которая «обслуживает» подобные устройство. В омнифонтовой системе распознавания текстов ABBYY FineReader вы можете осуществлять «TWAIN-взаимодействие» с вашим сканирующим устройством двумя способами.
Собственный интерфейс FineReader
Вы можете работать с вашим сканером через интерфейс FineReader. В этом случае для настройки опций процесса сканирования используется диалоговое окно программы FineReader Настройки сканера. В этом режиме, как правило, доступна функция предварительного просмотра изображения (preview), позволяющая точно задать размеры сканируемой области, подобрать яркость, тут же контролируя результаты этих изменений. К сожалению, диалоговое окно TWAIN-драйвера сканирующего устройства у каждого сканера выглядит по-своему, в большинстве случаев все надписи на английском языке.
Вы также можете работать с вашим сканирующим устройством через TWAIN-драйвера вашего сканирующего устройства. Для настройки опций процесса сканирования используется диалоговое окно TWAIN-драйвера сканера. В режиме Использовать интерфейс FineReader доступны такие опции, как возможность процесса сканирования в цикле на сканерах без автоподатчика, сохранение опций процесса сканирования в отдельный файл Шаблон пакета (*.fbt) и возможность использования этих опций в других пакетах.
Переключаться между этими режимами можно так:
• на закладке Сканирование/Открытие диалогового окна Опции (доступ: Сервис к Опции) активизируйте один из следующих переключателей:
• Использовать интерфейс FineReader.
• Использовать интерфейс TWAIN-драйвера сканирующего устройства.
Важно: Для некоторых моделей сканеров опция Использовать интерфейс FineReader может быть отключена по умолчанию.
Для того, чтобы в режиме Использовать интерфейс FineReader отображалось диалоговое окно Настройки сканера, на закладке Сканирование/Открытие (доступ: Сервис и Опции) активизируйте опцию Запрашивать опции перед началом процесса сканирования.
Важно: Для того, чтобы правильно подключить сканирующее устройство, обратитесь к фирменной документации. В процессе установки не забудьте установить все программное обеспечение, поставляемое вместе со сканером (драйвер TWAIN и/или сканирующую программу).
Как начать сканирование материала
Просто нажмите на кнопку 1-Сканировать или из меню Файл выберите команду Сканировать. Спустя некоторое время в Главном диалоговом окне программы обновится окно Изображение с «фотографией» отсканированной страницы.
В случае, если вы хотите отсканировать несколько страниц, то нажмите стрелку справа от кнопки 1-Сканировать и из ниспадающего меню выберите команду Сканировать несколько страниц.
В случае, если вы хотите сразу запустить распознавание отсканированных страниц, воспользуйтесь опцией Сканировать и распознать или Сканировать и распознать несколько страниц. Для этого нажмите стрелку справа от кнопки Scan amp;Read и из ниспадающего меню выберите одну из команд:
• Сканировать и распознать.
• Сканировать и распознать несколько страниц.
После этого в Главном окне программы появятся диалоговое окно Изображение с пиктограммой отсканированного материала и диалоговое окно Текст с результатом распознавания.
Параметры процесса сканирования
В омнифонтовой системе распознавания текстов ABBYY FineReader качество распознавания весьма сильно зависит от того, насколько хорошее изображение было получено в процессе процесса сканирования. Это достигается настройкой основных параметров процесса сканирования:
• Тип изображение.
• Разрешение изображения.
• Яркость изображения.
Для настройки основных параметров процесса сканирования из меню Сервис выберите команду Настройки сканера.
К примеру, для настройки режимов сканирования в диалоговом окне Настройки сканера обратитесь к ниспадающему списку Режим процесса сканирования картинок.
Серое изображение
Сканирование в сером является оптимальным режимом для ABBYY FineReader, так как в этом случае осуществляется автоматический подбор яркости.
Черно-белое изображение
Черно-белый режим распознавания обеспечивает более высокую скорость процесса сканирования, но при этом теряется часть информации относительно букв, что может привести к ухудшению качества распознавания на документах среднего и низкого качества печати.
Цветное изображение
Если вы хотите, чтобы включенные в документ цветные элементы (картинки, цвет букв и фона) были переданы в электронный документ с сохранением цвета, необходимо выбрать цветной режим распознавания. В других случаях используйте серый тип изображения.
Разрешение
В OCR-системе ABBYY FineReader разрешение 300 dpi обычно используется для обычных текстов с кеглем в 10 и более пунктов, а разрешение 400-600 dpi — для текстов, набранных мелким шрифтом (9 и менее пунктов).
Яркость
В большинстве случаев подходит среднее значение яркости — 50%. На некоторых документах при сканировании в черно-белом режиме вы можете дополнительно настроить яркость.
При сканировании через интерфейс TWAIN для установки параметров процесса сканирования используется диалоговое окно вашего сканирующего устройств. Это окно открывается сразу после нажатия на кнопку 1-Сканировать, при этом опции для настройки параметров процесса сканирования могут называться по-разному, в зависимости от модели вашего сканирующего устройства.
Под TWAIN-интерфейсом понимается международный стандарт, который в свое время был принят для единого взаимодействия устройств ввода изображений с той или иной программой, которая «обслуживает» подобные устройство. В омнифонтовой системе распознавания текстов ABBYY FineReader вы можете осуществлять «TWAIN-взаимодействие» с вашим сканирующим устройством двумя способами.
Собственный интерфейс FineReader
Вы можете работать с вашим сканером через интерфейс FineReader. В этом случае для настройки опций процесса сканирования используется диалоговое окно программы FineReader Настройки сканера. В этом режиме, как правило, доступна функция предварительного просмотра изображения (preview), позволяющая точно задать размеры сканируемой области, подобрать яркость, тут же контролируя результаты этих изменений. К сожалению, диалоговое окно TWAIN-драйвера сканирующего устройства у каждого сканера выглядит по-своему, в большинстве случаев все надписи на английском языке.
Вы также можете работать с вашим сканирующим устройством через TWAIN-драйвера вашего сканирующего устройства. Для настройки опций процесса сканирования используется диалоговое окно TWAIN-драйвера сканера. В режиме Использовать интерфейс FineReader доступны такие опции, как возможность процесса сканирования в цикле на сканерах без автоподатчика, сохранение опций процесса сканирования в отдельный файл Шаблон пакета (*.fbt) и возможность использования этих опций в других пакетах.
Переключаться между этими режимами можно так:
• на закладке Сканирование/Открытие диалогового окна Опции (доступ: Сервис к Опции) активизируйте один из следующих переключателей:
• Использовать интерфейс FineReader.
• Использовать интерфейс TWAIN-драйвера сканирующего устройства.
Важно: Для некоторых моделей сканеров опция Использовать интерфейс FineReader может быть отключена по умолчанию.
Для того, чтобы в режиме Использовать интерфейс FineReader отображалось диалоговое окно Настройки сканера, на закладке Сканирование/Открытие (доступ: Сервис и Опции) активизируйте опцию Запрашивать опции перед началом процесса сканирования.
Важно: Для того, чтобы правильно подключить сканирующее устройство, обратитесь к фирменной документации. В процессе установки не забудьте установить все программное обеспечение, поставляемое вместе со сканером (драйвер TWAIN и/или сканирующую программу).
Как начать сканирование материала
Просто нажмите на кнопку 1-Сканировать или из меню Файл выберите команду Сканировать. Спустя некоторое время в Главном диалоговом окне программы обновится окно Изображение с «фотографией» отсканированной страницы.
В случае, если вы хотите отсканировать несколько страниц, то нажмите стрелку справа от кнопки 1-Сканировать и из ниспадающего меню выберите команду Сканировать несколько страниц.
В случае, если вы хотите сразу запустить распознавание отсканированных страниц, воспользуйтесь опцией Сканировать и распознать или Сканировать и распознать несколько страниц. Для этого нажмите стрелку справа от кнопки Scan amp;Read и из ниспадающего меню выберите одну из команд:
• Сканировать и распознать.
• Сканировать и распознать несколько страниц.
После этого в Главном окне программы появятся диалоговое окно Изображение с пиктограммой отсканированного материала и диалоговое окно Текст с результатом распознавания.
Параметры процесса сканирования
В омнифонтовой системе распознавания текстов ABBYY FineReader качество распознавания весьма сильно зависит от того, насколько хорошее изображение было получено в процессе процесса сканирования. Это достигается настройкой основных параметров процесса сканирования:
• Тип изображение.
• Разрешение изображения.
• Яркость изображения.
Для настройки основных параметров процесса сканирования из меню Сервис выберите команду Настройки сканера.
К примеру, для настройки режимов сканирования в диалоговом окне Настройки сканера обратитесь к ниспадающему списку Режим процесса сканирования картинок.
Серое изображение
Сканирование в сером является оптимальным режимом для ABBYY FineReader, так как в этом случае осуществляется автоматический подбор яркости.
Черно-белое изображение
Черно-белый режим распознавания обеспечивает более высокую скорость процесса сканирования, но при этом теряется часть информации относительно букв, что может привести к ухудшению качества распознавания на документах среднего и низкого качества печати.
Цветное изображение
Если вы хотите, чтобы включенные в документ цветные элементы (картинки, цвет букв и фона) были переданы в электронный документ с сохранением цвета, необходимо выбрать цветной режим распознавания. В других случаях используйте серый тип изображения.
Разрешение
В OCR-системе ABBYY FineReader разрешение 300 dpi обычно используется для обычных текстов с кеглем в 10 и более пунктов, а разрешение 400-600 dpi — для текстов, набранных мелким шрифтом (9 и менее пунктов).
Яркость
В большинстве случаев подходит среднее значение яркости — 50%. На некоторых документах при сканировании в черно-белом режиме вы можете дополнительно настроить яркость.
При сканировании через интерфейс TWAIN для установки параметров процесса сканирования используется диалоговое окно вашего сканирующего устройств. Это окно открывается сразу после нажатия на кнопку 1-Сканировать, при этом опции для настройки параметров процесса сканирования могут называться по-разному, в зависимости от модели вашего сканирующего устройства.
Глава 29.
Процесс сканирования и распознавания печатного материала
• В программе ABBYY FineReader имеется специальная кнопка Scan and Read, которая дает возможность произвести полную обработку текста: отсканировать. распознать. проверить. сохранить результаты распознавания.
После того, как вы нажмете на кнопку Scan and Read начнется процесс процесса сканирования и распознавания печатного материала, а результат распознавания отобразится в двух диалоговых окнах Текст и Изображение.
В диалоговом окне Изображение вы увидите изображение отсканированного материала и выделенные блоки (участки изображения, выделенные в рамку; блок используется для распознавания и автоматического анализа части изображения).
В диалоговом окне Текст вы можете отредактировать распознанный текст вашего материала.
Кнопки на панели Scan and Read связаны с базовыми операциями системы, связанными со сканированием, распознаванием, проверкой и сохранением результатов распознавания.
Цифры на этих кнопках указывают, в каком порядке необходимо выполнить действия с тем, чтобы получить электронную версию бумажного документа. Каждое из этих действий можно провести по отдельности или объединить в одно, нажав на кнопку Scan amp;Read, которая дает возможность провести полный цикл обработки текста в автоматическом режиме.
Каждая из кнопок имеет несколько режимов работы. Нажав на стрелку справа от кнопки, вы сможете обратиться к ниспадающему меню и выбрать один из «ручных» режимов работы.
Scan and Read
Запустить специальный режим процесса сканирования и распознавания, во время которого OCR-система полностью контролирует ваши действия.
Сканировать и распознать
Запустить процесс процесса сканирования и распознавания документа.
Сканировать и распознать несколько страниц
Отсканировать и распознать несколько страниц в цикле.
Открыть и распознать
Открыть и распознать изображения, выбранные в диалоговом окне Открыть.
1-Сканировать
Открыть изображение
Добавить изображение в пакет, при этом копия изображения сохранится в папке пакета.
Сканировать изображение
Отсканировать изображение.
Сканировать несколько страниц
Отсканировать изображения в цикле. Для того, чтобы остановить сканирование, из меню Файл выберите команду Остановить сканирование.
Опции
Открывает закладку Сканирование/Открытие диалогового окна Опции, на которой вы имеете возможность задать опции процесса сканирования и параметры предварительной обработки документа.
2-Распознать
Распознать — распознает открытую страницу пакета.
Распознать все
Распознать все нераспознанные страницы пакета.
Опции
Открыть закладку Распознавание диалогового окна Опции, на которой Вы можете установить параметры распознавания документа.
З-Проверить
Проверить
Дает возможность найти в тексте слова, содержащие неуверенно распознанные символы.
Опции
Открыть закладку Проверка диалогового окна Опции, на которой вы имеете возможность установить опции проверки орфографии распознанного документа.
4-Сохранить
Мастер сохранения результатов — открывает диалоговое окно Мастер сохранения результатов, в котором вы имеете возможность выбрать приложение для сохранения и установить опции сохранения.
Сохранить текст в файл
Сохранить распознанный текст в файл на диск.
Передать страницы в
Напрямую передать распознанный текст в выбранное приложение без сохранения его на диск.
Совет: В процессе передачи распознанного текста с нескольких страниц пакета сначала выделите их в диалоговом окне Пакет.
Передать все страницы в
Передать все распознанные страницы в выбранное приложение без сохранения их на диск.
Опции
Открыть закладку Форматирование диалогового окна Опции, на которой вы имеете возможность установить опции сохранения документа.
После того, как вы нажмете на кнопку Scan and Read начнется процесс процесса сканирования и распознавания печатного материала, а результат распознавания отобразится в двух диалоговых окнах Текст и Изображение.
В диалоговом окне Изображение вы увидите изображение отсканированного материала и выделенные блоки (участки изображения, выделенные в рамку; блок используется для распознавания и автоматического анализа части изображения).
В диалоговом окне Текст вы можете отредактировать распознанный текст вашего материала.
Кнопки на панели Scan and Read связаны с базовыми операциями системы, связанными со сканированием, распознаванием, проверкой и сохранением результатов распознавания.
Цифры на этих кнопках указывают, в каком порядке необходимо выполнить действия с тем, чтобы получить электронную версию бумажного документа. Каждое из этих действий можно провести по отдельности или объединить в одно, нажав на кнопку Scan amp;Read, которая дает возможность провести полный цикл обработки текста в автоматическом режиме.
Каждая из кнопок имеет несколько режимов работы. Нажав на стрелку справа от кнопки, вы сможете обратиться к ниспадающему меню и выбрать один из «ручных» режимов работы.
Scan and Read
Запустить специальный режим процесса сканирования и распознавания, во время которого OCR-система полностью контролирует ваши действия.
Сканировать и распознать
Запустить процесс процесса сканирования и распознавания документа.
Сканировать и распознать несколько страниц
Отсканировать и распознать несколько страниц в цикле.
Открыть и распознать
Открыть и распознать изображения, выбранные в диалоговом окне Открыть.
1-Сканировать
Открыть изображение
Добавить изображение в пакет, при этом копия изображения сохранится в папке пакета.
Сканировать изображение
Отсканировать изображение.
Сканировать несколько страниц
Отсканировать изображения в цикле. Для того, чтобы остановить сканирование, из меню Файл выберите команду Остановить сканирование.
Опции
Открывает закладку Сканирование/Открытие диалогового окна Опции, на которой вы имеете возможность задать опции процесса сканирования и параметры предварительной обработки документа.
2-Распознать
Распознать — распознает открытую страницу пакета.
Распознать все
Распознать все нераспознанные страницы пакета.
Опции
Открыть закладку Распознавание диалогового окна Опции, на которой Вы можете установить параметры распознавания документа.
З-Проверить
Проверить
Дает возможность найти в тексте слова, содержащие неуверенно распознанные символы.
Опции
Открыть закладку Проверка диалогового окна Опции, на которой вы имеете возможность установить опции проверки орфографии распознанного документа.
4-Сохранить
Мастер сохранения результатов — открывает диалоговое окно Мастер сохранения результатов, в котором вы имеете возможность выбрать приложение для сохранения и установить опции сохранения.
Сохранить текст в файл
Сохранить распознанный текст в файл на диск.
Передать страницы в
Напрямую передать распознанный текст в выбранное приложение без сохранения его на диск.
Совет: В процессе передачи распознанного текста с нескольких страниц пакета сначала выделите их в диалоговом окне Пакет.
Передать все страницы в
Передать все распознанные страницы в выбранное приложение без сохранения их на диск.
Опции
Открыть закладку Форматирование диалогового окна Опции, на которой вы имеете возможность установить опции сохранения документа.
Глава 30.
Сканирование многостраничных документов
В программе ABBYY FineReader для удобства процесса сканирования большого количества страниц предусмотрен специальный режим процесса сканирования: Сканировать несколько страниц, который дает возможность в одном цикле отсканировать несколько страниц.
• Кроме этого: при сканировании через TWAIN с использованием интерфейса FineReader по окончании процесса сканирования страницы сканирующее устройство автоматически начинает сканирование следующей страницы. при сканировании через пользовательский TWAIN-драйвер ваш «Twain-диалог» с программой не завершается: После того, как прекратится процесс сканирования первой страницы, можно просто положить следующую страницу в «лоток» и продолжить распознавание.
В OCR-системе ABBYY FineReader вы имеете возможность отсканировать большое количество страниц двумя способами:
• с использованием автоподатчика сканера.
• без использования автоподатчика.
В диалоговом окне Настройки сканера (доступ: Сервис к Настройки сканера) активизируйте опцию Использовать автоподатчик бумаги ( ADF) и запустите сканирование нескольких страниц (доступ: Файл к Сканировать несколько страниц).
Интерфейс TWAIN — драйвера сканера
В собственном TWAIN-диалоге сканера активизируйте опцию Use ADF (опция может иметь другое название в зависимости от модели сканера) и запустите сканирование (доступ: Файл к Сканировать несколько страниц).
Из меню Файл выберите команду Сканировать несколько страниц.
Для удобства процесса сканирования нескольких страниц подряд на планшетном сканере без автоподатчика установите величину паузы (время от окончания процесса сканирования одной страницы до начала процесса сканирования следующей). Для этого в диалоговом окне Настройки сканера (доступ: Сервис к Настройки сканера) активизируйте опцию Пауза между страницами и установите значение паузы в секундах.
В этом случае, после процесса сканирования первой страницы сканер делает указанную вами паузу, во время у вас должно хватить времени поместить в сканирующее устройство еще одну страницу. Далее сканирование продолжится уже в автоматическом режиме.
Как «отдохнуть»
Попробуйте в диалоговом окне Настройки сканера (доступ: Сервис к Настройки сканера) активизировать опцию Останавливаться между страницами. Тогда по окончании процесса сканирования текущей страницы появится диалоговое окно с вопросом относительно продолжения процесса сканирования. Нажмите на кнопку Да для процесса сканирования следующей страницы или Нет — для завершения процесса сканирования.
Интерфейс TWAIN-драйвера сканера
Из меню Файл выберите команду Сканировать несколько страниц. Для начала процесса сканирования в раскрывшемся TWAIN-диалоговом окне сканера просто нажмите на кнопку Scan (название кнопки зависит от конкретной реализации TWAIN-драйвера вашего сканера) а для продолжения процесса сканирования нажмите на кнопку Scan в twain-диалоге сканера.
Для завершения процесса сканирования в Twain-диалоге сканера просто нажмите на кнопку Close (или аналогичную ей по смыслу).
Совет: Для того, чтобы вы могли контролировать результаты процесса сканирования, на закладке Сканирование/Открытие (доступ: Сервис к Опции) активизируйте опцию Открывать изображения по мере процесса сканирования. В этом случае отсканированное изображение появится в диалоговом окне Изображение. В случае, если изображение отсканировано неверно, остановите сканирование (из меню Файл выберите команду Остановить сканирование) и отсканируйте изображение заново.
Открытие файлов с изображениями
В OCR-системе ABBYY FineReader в случае, если у вас вообще нет сканирующего устройства, вы имеете возможность распознавать графические файлы, которые содержат текстовую информацию.
Как открыть изображение
Нажмите стрелку справа от кнопки 1-Сканировать и из ниспадающего меню выберите команду Открыть изображение. В диалоговом окне Открыть выберите изображения. Все они появятся в пакете программы, а последнее из выбранных изображений откроется в диалоговом окне Изображение и в диалоговом окне Крупный план, при этом копия изображения будет автоматически помещена в папку пакета.
Совет: В случае, если вы хотите, чтобы открытые изображения были сразу распознаны, воспользуйтесь режимом Открыть и распознать. Для этого из меню Процесс выберите команду Открыть и распознать (клавиатурный эквивалент: Ctrl + Shift + D) и в раскрывшемся диалоговом окне Открыть выберите изображения для дальнейшего распознавания.
Как добавить в пакет изображения со сдвоенными страницами
В омнифонтовой системе распознавания текстов ABBYY FineReader в процессе сканирования книг удобнее отсканировать две страницы (книжный разворот) сразу.
Кроме этого для повышения качества распознавания такие изображения следует разделить на два для того, чтобы каждой странице соответствовала отдельная страница пакета, так как анализ и конечный результат распознавания в программе осуществляется для каждой страницы по отдельности.
Для того, чтобы добавить в пакет сдвоенные страницы на закладке Сканирование/Открытие (доступ: Сервис к Опции) активизируйте опцию Делить разворот книги.
Как проверить и скорректировать полученное изображение
Распознаваемое изображение может быть сильно "замусорено. Это означает, что оно может содержать много лишних точек среднего или плохого качества, которые могут отрицательно сказаться на качестве распознанного текста. Для того, чтобы уменьшить количество лишних точек, можно воспользоваться опцией Очистить от мусора. Для этого просто из меню Изображение выберите команду Очистить изображение от мусора. В случае, если вы хотите очистить от «мусора» отдельный блок (участок изображения, выделенный в рамку), то из меню Изображение выберите команду Очистить блок от мусора.
Важно: В случае, если исходный текст был очень светлым или в исходном тексте использовался очень тонкий шрифт, то применение функции Очистить изображение может привести к исчезновению точек, запятых или тонких элементов букв, что ухудшает качество распознавания.
Важно: В случае, если вы сканируете или открываете «замусоренные» изображения, то перед тем, как поместить в пакет программы подобные изображения обратитесь к разделу Обработка изображений, который находится на закладке Сканирование/Открытие (доступ: Сервис к Опции) активизируйте опцию Очистить изображение от мусора.
Как инвертировать изображение
Некоторые сканеры переводят черный цвет в белый, а белый в черный. Для того, чтобы получить стандартное представление документа (черный шрифт на белом фоне из меню Изображение выберите команду Инвертировать.
Важно: В случае, если вы открываете инвертированные изображения, то перед добавлением в пакет программы таких изображений в разделе Обработка изображений на закладке Сканирование/Открытие (доступ: Сервис к Опции) обязательно активизируйте опцию Инвертировать.
Как повернуть или зеркально отразить изображение
В процессе распознавания изображение должно иметь стандартную ориентацию: текст должен читаться сверху вниз, и строки должны быть горизонтальными. По умолчанию программа при распознавании определяет и корректирует ориентацию изображения автоматически.
В случае, если ориентация изображения была определена ошибочно, то на закладке Сканирование/Открытие дезактивируйте опцию Определять ориентацию страницы (в процессе распознавания) и поверните изображение вручную.
• Как повернуть изображение на 90 градусов вправо — выберите из меню Изображение команду Повернуть по часовой стрелке на 90 градусов влево — выберите из меню Изображение команду Повернуть против часовой стрелки. на 180 градусов — выберите из меню Изображение команду Повернуть на 180 градусов.
• Вы можете отразить изображение относительно: горизонтальной прямой — выберите из меню Изображение команду Зеркальное отражение относительно горизонтали. вертикальной прямой — выберите из меню Изображение команду Зеркальное отражение относительно вертикали.
Как удалить фрагмент изображения
В случае, если вы хотите исключить какой-то участок текста из распознавания или у вас на изображении имеются большие участки мусора, то вы имеете возможность стереть его. Для этого:
Выберите инструмент (на панели в диалоговом окне Изображение) и, нажав на левую кнопку мыши, выделите участок изображения, который вы хотите удалить. Отпустите кнопку, выделенная часть изображения будет удалена.
Как изменить масштаб изображения
На панели Изображение (в диалоговом окне Изображение) выберите инструмент и щелкните левой кнопкой мыши на изображении. Изображение увеличится/уменьшится в два раза.
Нажмите правой кнопкой мыши на изображение и из меню выберите команду Масштаб и нужный вам масштаб.
Как получить информацию об изображении
• Вы имеете возможность получить следующую информацию об открытом изображении: ширину и высоту изображения в точках; вертикальное и горизонтальное разрешение в точках на дюйм (dpi); тип изображения.
Нажмите правой кнопкой на изображение и из меню выберите команду Свойства. В раскрывшемся диалоговом окне выберите закладку Изображение.
Отменить последнее действие
Для отмены последнего действия на панели Стандартная просто нажмите на кнопку Отменить.
Важно: Для повторного выполнения последнего отмененного действия на панели Стандартная просто нажмите на кнопку Вернуть.
Нумерация страниц при добавлении в пакет
По умолчанию каждой сканируемой странице присваивается номер на единицу больший номера последнего изображения в пакете.
Вы имеете возможность задать номер добавляемой страницы и вручную (например, вам необходимо сохранить исходную нумерацию страниц или вы сканируете стопку сортированных по порядку страниц). Для этого активизируйте опцию Запрашивать номер страницы при добавлении в пакет на закладке Сканирование/Открытие (доступ:Сервис к Опции).
В диалоговом окне Номер страницы укажите номер страницы, с которой начинается сканирование и выберите опцию Через одну в поле Нумерация страниц. Выберите способ нумерации страниц: по возрастанию или по убыванию. Возрастание или убывание зависит, например, от того, как вы кладете стопку в автоподатчик — находятся ли меньшие или большие номера наверху.
Уменьшать разрешение цветного/серого изображения до 100 dpi
Эта опция используется при добавлении в пакет цветных изображений большого размера. В этом случае, во-первых, пакет будет занимать меньше места на диске, а во-вторых, процесс обработки группы страниц будет происходить быстрее.
Важно: Эта опция не влияет на качество распознавания текста. Данное уменьшение разрешения влияет на качество сохраняемых картинок: разрешение картинок уменьшается до 100 dpi.
Как преобразовать цветное/серое изображение в черно-белое
Отметьте эту опцию при сканировании через TWAIN-диалог сканера в сером режиме (с автоподбором яркости) или при сканировании в цвете, если при этом сканируемые документы не содержат цветных картинок, цветного шрифта и фона или же вам не требуется передача цвета в выходное изображение. В этом случае сохраняемые в пакет изображения будут занимать меньше места на диске.
Как проанализировать макет страницы
Прежде чем приступить к распознаванию, программа должна знать, какие участки изображения необходимо распознавать. Для этого проводится анализ макета страницы, во время которого выделяются блоки с текстом, картинки, таблицы и штрих-коды (для версии Office).
Анализ макета страницы может проводиться как автоматически, так и вручную. В большинстве случаев FineReader сам успешно справляется с анализом сложных страниц. Автоматический анализ производится по кнопке 2-Распознать одновременно с распознаванием текста.
Важно: Отдельная процедура анализа макета страницы тоже доступна (доступ: Процесс к Анализ макета страницы). Правда, при этом качество сегментации может быть ниже, так как при совместной процедуре распознавания и сегментации для анализа страницы используется дополнительная информация, полученная в процессе распознавания.
• Кроме этого: при сканировании через TWAIN с использованием интерфейса FineReader по окончании процесса сканирования страницы сканирующее устройство автоматически начинает сканирование следующей страницы. при сканировании через пользовательский TWAIN-драйвер ваш «Twain-диалог» с программой не завершается: После того, как прекратится процесс сканирования первой страницы, можно просто положить следующую страницу в «лоток» и продолжить распознавание.
В OCR-системе ABBYY FineReader вы имеете возможность отсканировать большое количество страниц двумя способами:
• с использованием автоподатчика сканера.
• без использования автоподатчика.
Использование автоподатчика ADF
Интерфейс FineReaderВ диалоговом окне Настройки сканера (доступ: Сервис к Настройки сканера) активизируйте опцию Использовать автоподатчик бумаги ( ADF) и запустите сканирование нескольких страниц (доступ: Файл к Сканировать несколько страниц).
Интерфейс TWAIN — драйвера сканера
В собственном TWAIN-диалоге сканера активизируйте опцию Use ADF (опция может иметь другое название в зависимости от модели сканера) и запустите сканирование (доступ: Файл к Сканировать несколько страниц).
Без использования автоподатчика ADF
Интерфейс FineReaderИз меню Файл выберите команду Сканировать несколько страниц.
Для удобства процесса сканирования нескольких страниц подряд на планшетном сканере без автоподатчика установите величину паузы (время от окончания процесса сканирования одной страницы до начала процесса сканирования следующей). Для этого в диалоговом окне Настройки сканера (доступ: Сервис к Настройки сканера) активизируйте опцию Пауза между страницами и установите значение паузы в секундах.
В этом случае, после процесса сканирования первой страницы сканер делает указанную вами паузу, во время у вас должно хватить времени поместить в сканирующее устройство еще одну страницу. Далее сканирование продолжится уже в автоматическом режиме.
Как «отдохнуть»
Попробуйте в диалоговом окне Настройки сканера (доступ: Сервис к Настройки сканера) активизировать опцию Останавливаться между страницами. Тогда по окончании процесса сканирования текущей страницы появится диалоговое окно с вопросом относительно продолжения процесса сканирования. Нажмите на кнопку Да для процесса сканирования следующей страницы или Нет — для завершения процесса сканирования.
Интерфейс TWAIN-драйвера сканера
Из меню Файл выберите команду Сканировать несколько страниц. Для начала процесса сканирования в раскрывшемся TWAIN-диалоговом окне сканера просто нажмите на кнопку Scan (название кнопки зависит от конкретной реализации TWAIN-драйвера вашего сканера) а для продолжения процесса сканирования нажмите на кнопку Scan в twain-диалоге сканера.
Для завершения процесса сканирования в Twain-диалоге сканера просто нажмите на кнопку Close (или аналогичную ей по смыслу).
Совет: Для того, чтобы вы могли контролировать результаты процесса сканирования, на закладке Сканирование/Открытие (доступ: Сервис к Опции) активизируйте опцию Открывать изображения по мере процесса сканирования. В этом случае отсканированное изображение появится в диалоговом окне Изображение. В случае, если изображение отсканировано неверно, остановите сканирование (из меню Файл выберите команду Остановить сканирование) и отсканируйте изображение заново.
Открытие файлов с изображениями
В OCR-системе ABBYY FineReader в случае, если у вас вообще нет сканирующего устройства, вы имеете возможность распознавать графические файлы, которые содержат текстовую информацию.
Как открыть изображение
Нажмите стрелку справа от кнопки 1-Сканировать и из ниспадающего меню выберите команду Открыть изображение. В диалоговом окне Открыть выберите изображения. Все они появятся в пакете программы, а последнее из выбранных изображений откроется в диалоговом окне Изображение и в диалоговом окне Крупный план, при этом копия изображения будет автоматически помещена в папку пакета.
Совет: В случае, если вы хотите, чтобы открытые изображения были сразу распознаны, воспользуйтесь режимом Открыть и распознать. Для этого из меню Процесс выберите команду Открыть и распознать (клавиатурный эквивалент: Ctrl + Shift + D) и в раскрывшемся диалоговом окне Открыть выберите изображения для дальнейшего распознавания.
Как добавить в пакет изображения со сдвоенными страницами
В омнифонтовой системе распознавания текстов ABBYY FineReader в процессе сканирования книг удобнее отсканировать две страницы (книжный разворот) сразу.
Кроме этого для повышения качества распознавания такие изображения следует разделить на два для того, чтобы каждой странице соответствовала отдельная страница пакета, так как анализ и конечный результат распознавания в программе осуществляется для каждой страницы по отдельности.
Для того, чтобы добавить в пакет сдвоенные страницы на закладке Сканирование/Открытие (доступ: Сервис к Опции) активизируйте опцию Делить разворот книги.
Как проверить и скорректировать полученное изображение
Распознаваемое изображение может быть сильно "замусорено. Это означает, что оно может содержать много лишних точек среднего или плохого качества, которые могут отрицательно сказаться на качестве распознанного текста. Для того, чтобы уменьшить количество лишних точек, можно воспользоваться опцией Очистить от мусора. Для этого просто из меню Изображение выберите команду Очистить изображение от мусора. В случае, если вы хотите очистить от «мусора» отдельный блок (участок изображения, выделенный в рамку), то из меню Изображение выберите команду Очистить блок от мусора.
Важно: В случае, если исходный текст был очень светлым или в исходном тексте использовался очень тонкий шрифт, то применение функции Очистить изображение может привести к исчезновению точек, запятых или тонких элементов букв, что ухудшает качество распознавания.
Важно: В случае, если вы сканируете или открываете «замусоренные» изображения, то перед тем, как поместить в пакет программы подобные изображения обратитесь к разделу Обработка изображений, который находится на закладке Сканирование/Открытие (доступ: Сервис к Опции) активизируйте опцию Очистить изображение от мусора.
Как инвертировать изображение
Некоторые сканеры переводят черный цвет в белый, а белый в черный. Для того, чтобы получить стандартное представление документа (черный шрифт на белом фоне из меню Изображение выберите команду Инвертировать.
Важно: В случае, если вы открываете инвертированные изображения, то перед добавлением в пакет программы таких изображений в разделе Обработка изображений на закладке Сканирование/Открытие (доступ: Сервис к Опции) обязательно активизируйте опцию Инвертировать.
Как повернуть или зеркально отразить изображение
В процессе распознавания изображение должно иметь стандартную ориентацию: текст должен читаться сверху вниз, и строки должны быть горизонтальными. По умолчанию программа при распознавании определяет и корректирует ориентацию изображения автоматически.
В случае, если ориентация изображения была определена ошибочно, то на закладке Сканирование/Открытие дезактивируйте опцию Определять ориентацию страницы (в процессе распознавания) и поверните изображение вручную.
• Как повернуть изображение на 90 градусов вправо — выберите из меню Изображение команду Повернуть по часовой стрелке на 90 градусов влево — выберите из меню Изображение команду Повернуть против часовой стрелки. на 180 градусов — выберите из меню Изображение команду Повернуть на 180 градусов.
• Вы можете отразить изображение относительно: горизонтальной прямой — выберите из меню Изображение команду Зеркальное отражение относительно горизонтали. вертикальной прямой — выберите из меню Изображение команду Зеркальное отражение относительно вертикали.
Как удалить фрагмент изображения
В случае, если вы хотите исключить какой-то участок текста из распознавания или у вас на изображении имеются большие участки мусора, то вы имеете возможность стереть его. Для этого:
Выберите инструмент (на панели в диалоговом окне Изображение) и, нажав на левую кнопку мыши, выделите участок изображения, который вы хотите удалить. Отпустите кнопку, выделенная часть изображения будет удалена.
Как изменить масштаб изображения
На панели Изображение (в диалоговом окне Изображение) выберите инструмент и щелкните левой кнопкой мыши на изображении. Изображение увеличится/уменьшится в два раза.
Нажмите правой кнопкой мыши на изображение и из меню выберите команду Масштаб и нужный вам масштаб.
Как получить информацию об изображении
• Вы имеете возможность получить следующую информацию об открытом изображении: ширину и высоту изображения в точках; вертикальное и горизонтальное разрешение в точках на дюйм (dpi); тип изображения.
Нажмите правой кнопкой на изображение и из меню выберите команду Свойства. В раскрывшемся диалоговом окне выберите закладку Изображение.
Отменить последнее действие
Для отмены последнего действия на панели Стандартная просто нажмите на кнопку Отменить.
Важно: Для повторного выполнения последнего отмененного действия на панели Стандартная просто нажмите на кнопку Вернуть.
Нумерация страниц при добавлении в пакет
По умолчанию каждой сканируемой странице присваивается номер на единицу больший номера последнего изображения в пакете.
Вы имеете возможность задать номер добавляемой страницы и вручную (например, вам необходимо сохранить исходную нумерацию страниц или вы сканируете стопку сортированных по порядку страниц). Для этого активизируйте опцию Запрашивать номер страницы при добавлении в пакет на закладке Сканирование/Открытие (доступ:Сервис к Опции).
В диалоговом окне Номер страницы укажите номер страницы, с которой начинается сканирование и выберите опцию Через одну в поле Нумерация страниц. Выберите способ нумерации страниц: по возрастанию или по убыванию. Возрастание или убывание зависит, например, от того, как вы кладете стопку в автоподатчик — находятся ли меньшие или большие номера наверху.
Уменьшать разрешение цветного/серого изображения до 100 dpi
Эта опция используется при добавлении в пакет цветных изображений большого размера. В этом случае, во-первых, пакет будет занимать меньше места на диске, а во-вторых, процесс обработки группы страниц будет происходить быстрее.
Важно: Эта опция не влияет на качество распознавания текста. Данное уменьшение разрешения влияет на качество сохраняемых картинок: разрешение картинок уменьшается до 100 dpi.
Как преобразовать цветное/серое изображение в черно-белое
Отметьте эту опцию при сканировании через TWAIN-диалог сканера в сером режиме (с автоподбором яркости) или при сканировании в цвете, если при этом сканируемые документы не содержат цветных картинок, цветного шрифта и фона или же вам не требуется передача цвета в выходное изображение. В этом случае сохраняемые в пакет изображения будут занимать меньше места на диске.
Как проанализировать макет страницы
Прежде чем приступить к распознаванию, программа должна знать, какие участки изображения необходимо распознавать. Для этого проводится анализ макета страницы, во время которого выделяются блоки с текстом, картинки, таблицы и штрих-коды (для версии Office).
Анализ макета страницы может проводиться как автоматически, так и вручную. В большинстве случаев FineReader сам успешно справляется с анализом сложных страниц. Автоматический анализ производится по кнопке 2-Распознать одновременно с распознаванием текста.
Важно: Отдельная процедура анализа макета страницы тоже доступна (доступ: Процесс к Анализ макета страницы). Правда, при этом качество сегментации может быть ниже, так как при совместной процедуре распознавания и сегментации для анализа страницы используется дополнительная информация, полученная в процессе распознавания.
Глава 31.
Блоки
Типы блоков в OCR — системе ABBYY FineReader
Блоки — это заключенные в рамку участки изображения. Программой блоки выделяются для того с тем, чтобы указать OCR-системе, какие участки отсканированной страницы необходимо распознавать и в каком порядке. Кроме того по ним воспроизводится исходное оформление страницы. Блоки разных типов имеют различные цвета рамок. Вы имеете возможность изменить цвета рамок блоков на закладке Вид диалогового окна к Опции (доступ:Сервис к Опции) в разделе Объекты. В поле Объект выберите нужный тип блока, а в поле Цвет — требуемый цвет.
Выделение блоков «вручную» может понадобиться, если:
• Вы хотите распознать часть страницы.
• В результате автоматического анализа блоки были выделены неправильно.
Совет: В некоторых случаях качество автоматического анализа можно улучшить, правильно установив опции анализа макета. Проверьте установленные опции анализа (закладка Распознавание, меню Сервис к Опции).
В случае, если программа выделила неправильно некоторые блоки, часто оказывается быстрее исправить только их, воспользовавшись инструментами для редактирования блоков, а не выделять блоки на изображении заново вручную.
В процессе обработки изображений выделяют блоки следующих типов:
Зона Распознавания
Блок используется для распознавания и автоматического анализа части изображения. После нажатия на кнопку 2-Распознать выделенный блок автоматически анализируется и распознается.
Блоки — это заключенные в рамку участки изображения. Программой блоки выделяются для того с тем, чтобы указать OCR-системе, какие участки отсканированной страницы необходимо распознавать и в каком порядке. Кроме того по ним воспроизводится исходное оформление страницы. Блоки разных типов имеют различные цвета рамок. Вы имеете возможность изменить цвета рамок блоков на закладке Вид диалогового окна к Опции (доступ:Сервис к Опции) в разделе Объекты. В поле Объект выберите нужный тип блока, а в поле Цвет — требуемый цвет.
Выделение блоков «вручную» может понадобиться, если:
• Вы хотите распознать часть страницы.
• В результате автоматического анализа блоки были выделены неправильно.
Совет: В некоторых случаях качество автоматического анализа можно улучшить, правильно установив опции анализа макета. Проверьте установленные опции анализа (закладка Распознавание, меню Сервис к Опции).
В случае, если программа выделила неправильно некоторые блоки, часто оказывается быстрее исправить только их, воспользовавшись инструментами для редактирования блоков, а не выделять блоки на изображении заново вручную.
В процессе обработки изображений выделяют блоки следующих типов:
Зона Распознавания
Блок используется для распознавания и автоматического анализа части изображения. После нажатия на кнопку 2-Распознать выделенный блок автоматически анализируется и распознается.