---------------------------------------------------------------
Email: bmn@gosreg.adm.yar.ru
Date: 10 Nov 2000
---------------------------------------------------------------

Материалы этой страницы будут регулярно пополняться. Опытом OCR
делятся Максим Бычиков и Григорий Кудрявцев, у них на счету - ПСС Шекспира,
Стейнбека, Диккенс, ... всего около 60Мб подготовленных и вычитанных
электронных текстов.


    http://www.fcpa.com/product/prd_product_frame.html
    http://www.banctec.com/Products.CFM?Products__IDNumber=36

      ocr_bychkov_textfmt.rar





      Режимы форматирования: !!!!!
      Включить форматирование пробелами.
      Сохранять в txt-win формате.

      Команда: Разметить все блоки

      Ручной просмотр всех блоков по тифам, и коректировка блоков.

      Пакетный распознаватель.

      Мастер сохранение: Постранично - сохранять в txt-win формате.

      Склеиваем с нумератором страниц.

      Multiedit: Перекодировка в дос, пакетные макросы - перекодировка символов.
      Длинное тире... Таблица прилагается.

      1. Первичная обработка. Межстраничные разделители, Нумираторы...

      Сбитая табуляция... Лечим абзацем. Позиционирование по подозрительным
      местам.

      2. По бумажному тексту - стилевое выделение.

      3. Типовые ошибки. Поиск макросами...

      Спеллчек, досовский DC-1991.