TheLib.Ru » Компьютеры » Домашний_компьютер » Домашний компьютер № 9 (123) 2006 » онлайн-чтение (стр. 8)

   Самое забавное, что такая история вполне может иметь место в реальной жизни. Пока другие компании продвигают «стильные» модели в верхней ценовой категории, китайская TCL Communication решила под брендом Alcatel осчастливить бюджетный сегмент. Так и появился аппарат Liquid OT-C750 by Alcatel — в зализанном корпусе из блестящего пластика, который заставит одних вспомнить советскую мыльницу шестидесятых годов прошлого века, а кого-то — киборга Т-1000 из блокбастера «Терминатор-2». Пожалуй, это первый на моей памяти телефон, у которого в выключенном состоянии невозможно найти экран, однако он есть — с разрешением 128х160 и поддержкой до 65 тысяч цветов. Выполнен экран по технологии CSTN, что само по себе затрудняет его использование на солнечной улице, да тут еще вмешивается «жидкометаллическая» тонировка, из-за которой приходится долго вертеть аппарат в руках, пытаясь хоть что-то под ней разглядеть. Цитатка о том, что красота требует жертв, здесь особенно актуальна.
   Остальные возможности аппарата характерны для большинства бюджетных трубок: три мегабайта набортной памяти без возможности расширения, 32-тональная полифония без поддержки mp3 и WAV, VGA-камера разновидности «чтобы было» (размер снимка в «высоком» качестве — шесть с половиной килобайт!), из средств коммуникации с внешним миром — только инфракрасный порт. Ну и еще, конечно, — потрясающая способность OT-C750 притягивать отпечатки пальцев — буквально через несколько минут после того, как он окажется у вас в руках, его можно использовать в качестве учебного пособия для начинающего криминалиста. Наверное, именно поэтому в коробке с С750-м обнаруживается небольшой замшевый мешочек, которым так удобно стирать с блестящей поверхности все лишнее.
   Мой экземпляр аппарата по умолчанию был настроен как-то странно — он все время моргал экраном и кнопочками, отчего аккумулятор садился в течение одного дня. Потом выяснилось, что проблема вызвана несовместимостью с сетью МТС. После упорных раскопок в инструкции и меню подмигивание удалось устранить, и аппарат вышел на паспортные трое суток от одного заряда. К качеству приема претензий не имею — оно очень достойное, как и у всех аппаратов Alcatel, попадавших ко мне в руки в последнее время.
   Резюме: Alcatel OT-C750 — загадочное сочетание типовой бюджетной начинки и экстравагантного дизайна. Если вы хотите примерно за $120 получить возможность пару недель удивлять своих знакомых, смело отправляйтесь в магазин.

Рубрика: МЯГКАЯ РУХЛЯДЬ

Утонченное чтиво
Автор: Евгений Яворских.

Значительное число пользователей считает, что негоже им на домашнем компьютере применять «домашние» версии приложений: наличие приставки Home означает для них несмываемый позор: только Pro — и никаких компромиссов. В итоге система «бомбардируется» тяжеловесными и навороченными профессиональными пакетами, а главная цель такой экспансии — исключительно желание покрасоваться. Дай бог, чтобы при этом использовали хотя бы десятую часть функциональных возможностей софтверных тяжеловесов…

   Жизненное наблюдение: едва освоив назначение кнопок системного блока, некоторые сразу же причисляют себя к клану IT-профессионалов — теперь им обеспечено внимание и почет со стороны тех, кто так и не научился правильно выключать компьютер. Самое забавное, что амбиции этих «профи» чрезвычайно высоки: если системный блок — то самый навороченный, если мышка — то непременно профессиональная 22 , а уж софт… И тут уж чувство меры теряется напрочь, поскольку еще не оскудели сетевые закрома с программами, готовыми к употреблению.
   Неизбывная вера в некие магические функции Pro-версий программного обеспечения витает в головах и более толковых граждан. В самом деле, чем же отличаются профессиональные версии программ от домашних? Может быть, Pro работают лучше, нежели их простые собратья? Есть ли смысл расходовать дисковое пространство на более «тяжелые» вариации софта или достаточно обычных версий? Не следует забывать и о материальной стороне вопроса: неискушенный пользователь рискует истратить гораздо большую сумму за Pro-инкарнацию программы, нежели за обычную (или Home).
   Попробуем разобраться с программными «профессионалами» на примере линейки продуктов для распознавания текста от компании ABBYY — семейство FineReader (или «Утонченный Чтец» в вольном переводе). Полагаю, четырех приложений, различающихся функциональными возможностями и, разумеется, ценой, будет вполне достаточно. Однако для более корректного сравнения возможностей этих программ следует уяснить основные принципы систем распознавания текста.

Что такое OCR

   Представьте ситуацию, когда вам требуется ввести в компьютер солидный объем информации: это могут быть книжные и альбомные страницы, офисные документы, газеты и прочее. Согласитесь, перспектива столь рутинного труда вряд ли способна обрадовать, поэтому и были придуманы системы распознавания или OCR-системы (Optical Character Recognition). Все, что вам понадобится — это сканер, программа распознавания и, конечно же, исходные «бумажные» документы (толковые OCR-системы умеют распознавать текст в графических и PDF-файлах).
   Механизм работы с такой системой чрезвычайно прост: вы загружаете документ в сканер, нажимаете определенную кнопку в окне программы, проверяете полученный результат, после чего даете команду сохранить распознанную информацию в один из поддерживаемых форматов (Word, Excel, HTML, RTF, PDF, TXT). Наиболее трудоемкая операция — это проверка результата распознавания и воссоздание оформления исходного документа: количество ошибок, допущенных при этом, в идеале должно быть единичным, а качество передачи оформления исходного документа должно максимально соответствовать «исходнику».
   Немаловажную роль играют языки распознавания, встроенная поддержка проверки орфографии 23 , работа с таблицами и многоколоночными текстами, с цветом (сохранение цветных картинок и цвета шрифта, фона), скорость и простота использования. Чуть позже мы рассмотрим, чем «грешат» домашние версии и чем могут гордиться профессиональные. Начнем с самого «легкого» приложения, рассмотрев на его примере некоторые приемы работы, присущие всей линейке.

Параметры сканирования

Качество распознавания во многом зависит от параметров сканируемого изображения. Качество изображения регулируется установкой основных параметров сканирования: типа изображения, разрешения и яркости. Оптимальным типом в данном случае считается «Серый (256 градаций)», при этом будет осуществлен автоматический подбор яркости. Черно-белый тип обеспечивает более высокую скорость сканирования, но при этом будет утрачена часть информации о буквах, что может привести к ухудшению качества распознавания на документах среднего и низкого качества печати.
Если вам нужно, чтобы цветные элементы сканируемого документа (иллюстрации, цвет букв и фона) были переданы в FineReader точно, необходимо выбрать цветной тип изображения. Разрешение рекомендуется не более 300 dpi для обычных текстов (размер шрифта 10 и более пунктов) и 400—600 dpi для текстов, набранных мелким шрифтом (9 и менее пунктов). Для яркости в большинстве случаев подходит среднее значение — 50%.

ABBYY FineReader 6.0 Sprint

   Самый простой продукт распознавания (65 Мбайт) вы не сможете купить отдельно — он поставляется в комплекте со сканерами и многофункциональными устройствами. Ряд пользователей относятся к такому «сопутствующему» софту с легким презрением, полагая «Спринт» недостойным их внимания. Но возможно, на первых порах «Спринт» вполне устроит вас, поскольку удобен и прост в использовании, а распознавание документа происходит с помощью одной кнопки Scan amp;Read.
   Предлагается 13 языков установки, в том числе и русский. Учтите, выбирая язык, вы тем самым определяете локализацию интерфейса: в дальнейшем этот параметр изменить невозможно. По умолчанию будут установлены значок ABBYY FineReader в панели инструментов MS Word, а также огромное число языков распознавания, сгруппированных в четыре категории: «Основные» (наиболее употребимые языки), «Дополнительные» (сюда попали, например, албанский, белорусский, фиджи и гагаузский), «Формальные» (языки программирования и простые химические формулы) и «Искусственные» (эсперанто, интерлингва и другие). Нет смысла вводить все языки распознавания, в особенности, если вы не работаете с документами на языке Чаморо или Гуарани — экономия дискового пространства 24 окажется весьма существенной.
   Интерфейс программы являет образец аскетизма: две активные кнопки плюс рекламная (рис. 1).

   Что сделает пользователь, начинающий знакомство с программой? Очевидно, в силу природного любопытства отправит под крышку сканера текстовый документ и нажмет кнопку «Сканировать». Точно так же поступим и мы, используя в качестве «подопытного кролика» страницу с русским текстом. Однако, каждый сканер имеет свою фирменную утилиту 25 , где необходимо указать оптимальные параметры сканирования, так как бездумные настройки сканера могут снизить результат распознавания.
   Для предварительного просмотра сканируемого документа в утилите моего сканера используется кнопка Preview: после недолгой калибровки девайса в окне появляется исходный документ. Еще раз повторю: нет абсолютно одинаковых интерфейсов, и вам придется самостоятельно отыскать параметры, регулирующие разрешение сканирования и тип документа. В данном случае этим «ведают» опции Output Resolution и Color Mode, где и были заданы оптимальные параметры сканирования. В рассматриваемом примере нет нужды сканировать весь текстовый документ, содержащий поля большого размера, — кроме увеличения времени сканирования мы ничего не получим. При помощи кнопки обрезки выделим нужную область и запустим процесс (кнопка Scan).
   По окончании сканирования страница документа отобразится в левой части окна FineReader 6.0 Sprint (рис. 2)

— обратите внимание на слово «Изображение»: действительно, в данный момент наша исходная «бумага» представлена в графической форме, поскольку сканер не способен переводить результат своей работы в другой формат. Этим и будет заниматься программа распознавания. Теперь вспомним о языках распознавания: наш текст написан по-русски, следовательно, выбрать нужно именно русский в меню «Язык». Если будет выбран «не родной» язык, то результат распознавания не сможет расшифровать ни одна разведка мира. Теперь нажмем кнопку «Распознать» и спустя несколько секунд получим текст в правой части программного окна (рис. 3).

Увы, результат не радует — софтина выделила текстовые блоки зеленым цветом, что называется, «от фонаря», притом что текст исходного документа был напечатан очень качественно. В результате такой «вольности» распознался не весь текст. Интересный нюанс: автограф на «исходнике» был распознан как графический блок, но и здесь все очень плохо — два отдельных блока на несколько рукописных букв. В таких случаях можно исправить положение дел, если растянуть границы блоков, потянув мышью за узловые точки. Не так уж это и трудно, но есть и более простой способ: меню Процесс · Анализ макета страницы.
Замечательно, теперь выделен весь текст без малейших потерь, но ситуация с автографом не улучшилась (рис. 4)

— что же, без ручной корректировки границ блоков нам не обойтись: потянув за угол зеленого блока на автографе, сдвинем зеленую границу вправо. Аналогичную операцию проделаем и с красными блоками, растянув один из них на всю площадь рукописного текста (рис. 5).

   Если программа ошибется и неверно определит тип блока (что бывает крайне редко), можно исправить положение посредством группы команд «Тип блока» в меню «Изображение»: при необходимости вы без труда измените текстовый блок на графический или табличный.
   Повторно нажимаем на кнопку «Распознать», и, казалось бы, можно праздновать победу, ан нет. Проявился «глюк»: в тексте имеется словосочетание Sales Guide, и оно превратилось в «8а!е8 СиЫез». Причина станет понятной, если вы загляните в меню «Язык». В нашем случае текст — двуязычный, то есть кроме русского в нем встречаются несколько английских слов, а «Спринт» не умеет распознавать такие конструкции. Впрочем, в конкретном документе неверно распознанные символы несложно исправить вручную, но для этого потребуется сохранить результат в какой-либо удобоваримый формат: кнопка «Сохранить».
   «Мастер сохранения результатов» предложит несколько вариантов готового документа (рис. 6)

   — вам достаточно выделить нужный формат и нажать ОК. Впрочем, можно обойтись и без услуг г-на «Мастера», если открыть выпадающее субменю кнопки «Сохранить». При конвертации в формат MS Word программа полностью сохранит как форматирование текста, так и размер и тип шрифта.
   Обратите внимание на опцию «Передать в Adobe Acrobat»: у данной версии FineReader нет встроенного инструмента конвертации распознанного текста в PDF-формат, и она надеется на помощь стороннего продукта. Посмотрим, как поведут себя по отношению к PDF более продвинутые версии. Опция «Передать в веб-браузер» подразумевает создание веб-страницы. Для активации этой функции потребуется бесплатно зарегистрироваться на сайте разработчика: меню Справка · Активация экспорта в HTML 26 . Только не дай вам бог увидеть HTML-код такого документа — то же нагромождение бессмысленных тэгов, что и при создании веб-страниц в среде MS Word. Впрочем, другого результата нельзя ожидать.
   Вся линейка FineReader обучена распознавать не только отсканированный текст, но и графические изображения, содержащие буквы и цифры (поддерживаются форматы BMP, TIFF, PNG, DCX и PCX). Сергей Костенок заранее усложнил задачу, предложив «скормить» программе обложку одного из продуктов ABBYY 27 (любит он поиздеваться над софтом) — посмотрим, как «Спринт» это осилит: меню Файл · Открыть изображение (Ctrl+O). Распознавание графики ничем не отличается от описанной выше процедуры, и результат можно было предсказать заранее: латинские буквы отобразились неверно (рис. 7).

Неизвестно почему программа отказалась распознавать и логотип своей компании, а его, по логике, можно смело рассмаривать как графический блок. Ну да ладно: не зря в программном окне красуется здоровенная кнопка «Профессиональная версия». Похоже, снобизм части пользователей по отношению к «урезанным» версиям вполне оправдан?.. Давайте разбираться.

Конкуренты

   Российская разработка CuneiForm 2000 компании Cognitive Technologies (16 Мбайт, $129) призвана выполнять те же задачи, что и FineReader. Демо-версия CuneiForm 2000 рассчитана на 100 запусков или на использование в течение 30 дней и позволяет распознавать тексты на русском, английском, русско-английском, немецком и французском языках (в нее не входят 15 дополнительных языковых библиотек). На сайте разработчиков предлагаются два варианта программы: CuneiForm 2000 R2 с русским интерфейсом и CuneiForm 2000 Professional (английский интерфейс). В списке поддерживаемых операционных систем нет Windows 2000/XP. При установке CuneiForm 2000 R2 в среде WinXP приложение выдало ошибку и тихонько испустило дух. Правда, при установке в раздел FAT32 (Windows 98SE) все прошло благополучно. Оказалось, что сей продукт не работает в среде Windows 2000/XP (что неудивительно, ведь число 2000 в названии означает год появления продукта). Комментарии излишни…
   Readiris Pro 7 — профессиональная программа. По словам производителей (20 Мбайт, $130), для данной OCR характерна высочайшая точность преобразования обычных печатных документов (письма, факсы, журнальные статьи, газетные вырезки) в объекты, доступные для редактирования (включая файлы PDF). Работает со всеми версиями Windows. Поддерживаются 92 языка, включая русский.
   OmniPage 11 ($600), продукт компании ScanSoft. Разработчики утверждают, что их программа практически со 100% точностью распознает печатные документы, восстанавливая их форматирование, включая столбцы, таблицы, переносы, заголовки, названия глав, подписи, номера страниц, сноски, параграфы, нумерованные списки, красные строки, графики и картинки. Есть возможность сохранения в формат Microsoft Office, PDF и в 20 других форматов, распознавания из файлов PDF и редактирования в формате PDF.

ABBYY FineReader 7.0 Home Edition

Судя по размеру дистрибутива и стоимости продукта — 115 Мбайт и 1100 рублей — есть все основания надеяться на более качественную работу. Параметры установки те же, что и в ABBYY FineReader 6.0 Sprint, за исключением лишь двух языков установки (и, следовательно, интерфейса) — русского и английского. Не забывайте о колоссальном числе языков распознавания и в меню отметьте лишь необходимые, отбросив заведомую экзотику.
Окно домашней версии почти ничем не отличается, и, разумеется, кнопка «Профессиональная версия» никуда не исчезла 28 (рис. 8).

Так в чем же разница? Ответ получим после сканирования «бумажного» документа (параметры сканирования ничем не отличаются от «спринтерских»). Результат гораздо лучше: текст полностью окружен зеленой границей блока, вот, разве что, с рукописной частью документа снова вышла накладка (рис. 9).

Но мы уже знаем, как исправить такое недоразумение.
По умолчанию предлагается русский язык распознавания, но, как вы помните, при сканировании документа, содержащего смесь латиницы и кириллицы, ничего хорошего не выйдет. Однако цена продукта себя должна оправдать: зайдите в меню Язык · Выбор нескольких языков и в открывшемся окне «Язык распознаваемого текста» поставьте флаг в переключателе «Русско-Английский» (рис. 10).

   Теперь смело нажимайте кнопку «Распознать», радуйтесь абсолютно корректному результату, после чего сохраняйте сканированный документ в удобный для вас формат.
   Точно так же, как и в ABBYY FineReader 6.0 Sprint, вам придется активировать опцию экспорта распознанного текста в HTML-формат, а для конвертации в PDF использовать «великий и ужасный» Adobe Acrobat — встроенный PDF-инструментарий отсутствует и в домашней версии. Лучше программа справилась и с распознаванием сложного графического файла с обложкой 29 : границы текстовых и графических блоков оказались более корректными.
   С точки зрения функциональности Home-версия отличается от «Спринта» лишь одним: функцией выбора комбинации английского и русского языков распознавания. Безусловно, для части пользователей такая возможность более чем актуальна. Кроме того, даже наш небольшой тест показывает, что алгоритмы работы программ так же отличаются: так, лучше работает автоматическое выделение блоков, что уменьшает необходимость ручной подгонки. Осталось узнать, чем же столь хороша профессиональная версия, столь рекламируемая разработчиком. «Вскрытие» покажет.

FineReader 8.0 Professional Edition

Уж здесь-то все должно быть замечательно. А как же иначе? Аккурат — 383 Мбайта дистрибутива и цена 3700 рублей. Впрочем, можно загрузить испытательную версию (40,5 Мбайт), лишенную дикого количества языков распознавания, их при необходимости без труда можно загрузить с сайта компании. Мы же займемся установкой «коробочной» версии программы.
Что вы скажете о девятнадцати языках установки продукта? Согласен, мало кому из русскоязычных пользователей понадобятся эстонский или турецкий языки инсталляции. Зато следующий шаг оценят многие: меню выборочной установки предлагает несколько языковых вариаций программного интерфейса (рис. 11).

Кроме того, по вашему желанию будут установлены «Руководство пользователя» в формате PDF, обучающие примеры и утилита ABBYY Screenshot Reader, способная распознавать текст не просто со скриншотов, являющихся графическими файлами (два предыдущих приложения умели «читать» графику), а непосредственно с экрана компьютера. Заманчиво.
Настоящий профессионализм не терпит суеты и спешки: установка FineReader 8.0 Professional Edition длится гораздо дольше своих «младших» собратьев — около пяти минут. При первом запуске софтины вам предложат онлайн-активацию продукта, занимающую несколько секунд времени, после чего, наконец-то, откроется главное окно (рис. 12).

Поначалу разбирает смех: профессиональная версия настойчиво предлагает курс обучения на демо-примерах вкупе с услугами «Мастера Scan amp;Read» (рис. 13).

Затем понимаешь, что данная версия подразумевает не только профессионализм пользователя, а скорее профессиональный подход к освоению программы, что существенно отличается от рассмотренных выше аналогов. Что касается по-настоящему толковых пользователей, так они не станут издеваться над приглашением «Мастера», а снимут флаг в чекбоксе «Показывать диалог при запуске ABBYY FineReader» и начнут работать.
На мой взгляд, профессионализм приложения — это и максимальная простота работы: обратите внимание на выпадающий список языков распознавания, где изначально предлагается «русско-английский коктейль». Казалось бы, мелочь, а экономия трудозатрат налицо. Та же картина и в выпадающем меню кнопки Scan amp; Read (рис. 14):

профессионал ценит свое время и не станет бездумно щелкать по кнопкам, он знает, что хочет от программы — например, «Сканировать в PDF». Это вам не услужливый «Мастер», а набор из трех программных сценариев, то бишь нескольких последовательных шагов, каждый из которых соответствует этапу обработки документа (рис. 15).

   И здесь экономия времени — переход от одного шага сценария к другому происходит автоматически.
   Не нравятся встроенные сценарии? Сделайте свой, «заточенный» под определенный документ или ваше настроение в данное время суток: меню Сервис · Менеджер сценариев (Ctrl+T). Причем для собственных сценариев можно добавить и малую толику ручной работы, например, правку отсканированной страницы или создание блоков.
   FineReader 8.0 Professional Edition умеет сохранять распознанную информацию в формате PDF. Для вывода диалога сохранения результатов не мудрствуйте, а нажмите комбинацию клавиш Ctrl+S и выберите нужный формат, включая PDF.
   В отличие от программ, рассмотренных выше, профессиональная версия имеет функцию проверки текста (кнопка «Проверить»). Кроме «очепяток» будут отслеживаться символы, в правильности распознавания которых FineReader не уверен. Программа известит о «неуверенно распознанном символе» (рис. 16)

и будет терпеливо ожидать вашего решения — все точно так же, как и в аналогичном инструменте MS Word. Тексты хорошего и среднего качества, а также шрифты обычного начертания читаются без проблем, а для текстов, в которых используются декоративные шрифты или встречаются специальные символы (например математические), предусмотрен режим «Распознавание с обучением»: в меню Сервис · Опции перейдите на вкладку «Распознать» и поставьте флаг в переключателе «Распознавание с обучением» (рис. 17).