СОФТЕРРА: Память на лица, или Лица на память

 
    Автор: Алексей Климов
    Вышла девятая версия ACDSee. Судя по объему нововведений, это не «Девятый вал»Айвазовского [Иван Айвазовский, «Девятый вал». 1850 г] и даже не «9 рота»Бондарчука [Федор Бондарчук, «9 рота». 2005 г]. Поэтому в обзоре рассматривается не сама программа, а способы запоминания лиц и имен с ее помощью.
   Для тренировки памяти на имена-лица нам потребуется новейшая версия и никакая другая. Благодаря нескольким опциям «девятка» соответствует поставленным задачам полнее, чем флагманская (втрое более дорогая) ACDSeePRO 8.1. На кого рассчитывает производитель, продавая одновременно оба продукта?
   Исходя из сравнительной таблицы версий, можно наметить грань между любителем фотографий и фотолюбителем. У первого в шкафу стоят пухлые фотоальбомы, почти каждая карточка в которых старательно подписана на обороте. У второго шкаф украшают сменные объективы, вспышки и штативы. А фотографиям всех времен и форматов отведена коробка из под обуви.
   То есть те, кому нравятся изображения, готовы мириться с хлопотами по их получению, а кто-то любит сам фотопроцесс и редко удовлетворен его итогом. Для причисления себя к одной из рассмотренных категорий прикинем затраты времени на каждый кадр с вашего жесткого диска. Если в видоискатель фотоаппарата вы смотрите чаще и дольше, чем в монитор, - ACDSee 9 не для вас, фотолюбитель. А вот те, кто не брезгует дважды, четырежды, а то и бесконечно пересматривать (не перепоказывать) отснятый материал, наконец дождались праздника на улице «Мои рисунки».
   Предвидя трудности в освоении англоязычного интерфейса, наметим приемы использования новых возможностей программы без обращения к нудному руководству пользователя [Руководство не осилил даже автор русификатора].
   Для начала представим себе оборотную сторону цифровой фотографии в самом прямом смысле. Что бы мы увидели с изнанки, перевернув «лицом вниз» графический файл? Чистый лист, зеркальное изображение, HEX-код? Для прикладных задач условимся считать электронный снимок аналогом бумажного, допускающего подпись на обороте как на чистом листе. Тогда нам не придется изучать особенности формата JPG и разбираться, где и как сохраняется дополнительная информация о кадре - в текстовых EXIF-полях, связанном аудиофайле или общей базе ACDSee. Дело в том, что хранить фотографии без подписей - все равно что запоминать лица без фамилий.
   Мы плохо запоминаем имена и лица лишь по той причине, что мало этим интересуемся и недостаточно сосредотачиваемся на проблеме. Между тем возможные алгоритмы запоминания очень просты [Хэнкок Дж. Самоучитель по развитию памяти. Уникальная методика запоминания: имен и лиц, телефонных номеров, дней рождения и важных дат, иностранных языков, экзаменационных билетов. - Пер. с англ. Штаерман В. - М.: Эксмо. 2004. 320 с], а с компьютером становятся еще проще.
   Пытаясь каждый семестр запомнить по две сотни новых студентов, я пришел к следующей тактике работы с ACDSee. Несколько минут на одной из первых лекций мы посвящаем настройкам разношерстных мобильников с целью отправки фотографий каждого желающего студента на единый адрес электронной почты. Причем имя графического файла содержит имя, фамилию и дату рождения изображенного человека.
   Далее фотографии сортируются по папкам-именам «Александр», «Алексей», «Андрей»… А если вы уверены в длительной работе вашей копии ACDSee, можно свалить все файлы в одну кучу, создав и присвоив каждому соответствующую имени категорию, а фамилии и даты рождения ввести как параметры Keywords вкладки Database.
 
 
   Теперь остается время от времени просматривать лица всех Алексеев, Сергеев и Елен, пока они не примелькаются в именных блоках. Вот здесь и окажется востребованной главная новинка ACDSee 9 - модуль Showroom, запускаемый как из основного окна программы, так и автономно. Казалось бы, чем хорош простейший генератор слайдшоу, последовательно или хаотично перебирающий все файлы в папке? Однако среди настроек этого плейера имеется регулятор прозрачности окна и возможность запуска нескольких просмотров одновременно. Благодаря указанным свойствам я вычитываю текст данного материала «сквозь» череду лиц, а имена пробую запомнить на уровне подсознания (рис. 1).
   Если нужно запомнить очень много людей (например, вы назначены аниматором грандиозного семинара), полезно сопроводить каждую фотографию всей необходимой информацией о человеке и просматривать получившуюся картотеку в режиме классического слайдшоу, указав в качестве подписи к снимкам все заполненные для них поля (Create Slide Show File\Wizard\Caption\Insert MetaData Tag\Apply to all - это доступно в ACDSee версии с пятой). Тогда вы сможете на первой же встрече выдать незнакомому гостю потрясающую сентенцию о его малой родине, большом хобби, среднем сыне и т. д. Главное, не перепутать анкеты.
 
 
   Еще одно новшество «девятки» - Table of Contents из выпадающего меню Group By - попробуйте приспособить для мнемонических упражнений самостоятельно. Опираясь на возможность создания, по сути, «именного указателя» графических файлов легко построить и невольно запомнить любую структуру из имен, должностей, паролей и лиц. Доступна сортировка по ключевому слову (Keywords) или рейтингу (Rating), если они заранее присвоены каждому файлу в соответствие с именем изображенного лица на вкладке Database.
   Дабы продемонстрировать отличия навигации в Table of Contents от проводника Windows, на рис. 2 показана кластеризация по размеру файлов с изображениями. Для этого параметра ACDSee создает оглавление содержимого вашего диска, объединяя файлы в группы по размеру: «огромные», «большие», «увесистые», «средние», «маленькие», «очень маленькие» и «ничтожные». При этом за вами сохраняется возможность оперативно добавлять в область просмотра (и автоматической кластеризации, в данном случае по размеру файла) содержимое скольких угодно папок из дерева каталогов слева. Одновременный просмотр миниатюр из нескольких папок осуществляется путем выставления галочки слева от интересующей папки.
 
   Вообще, парадигма организации изображений в ACDSee кажется позаимствованной из опыта работы деканата какого-нибудь университета. Программа способна отображать в одном окне фотографии из множества папок, группируя и перегруппировывая их по десяткам признаков: дате, размеру, сюжету, формату и т. п. Так поступает опытный декан, затребующий личные дела, скажем, всех студентов-спортсменов с третьего по пятый курс, назначающий матпомощь из расчета вес/рост или собирающий задолжников по ключевому предмету. В реальном мире такие задачи решаются оперативно, при том что личные дела студентов рассортированы в папки по единственному критерию - номеру группы - и содержат плохенькие фотографии.
   Продолжая тренировку памяти, запомните дни рождения всех фигурантов вашей записной книжки с картинками (а именно в нее сейчас превратится ACDSee). Для любителей сортировать знакомых по гороскопу добавлена новая опция работы с календарем - Events View (Ctrl+Shift+4). Чтобы не возиться с ранее описанным заполнением полей Database, которые к тому же недоступны вне ACDSee, попросите друзей и коллег присылать свои визитные фотографии в графических файлах с отредактированной датой. Изменить дату файла на дату рождения можно самостоятельно в популярном файловом менеджере Total Commanderили в том же ACDSee через Tools\Adjust Image Time Stamp. Конечно, хронологическая сортировка пригодится и во множестве других случаев. Навигация в море снимков облегчается благодаря тому, что каждый съемочный день можно снабдить пиктограммой и текстовым пояснением.
   Учитывая специфику отечественного программопользования, рационально подстраховаться от невосполнимой потери старательно выстроенной электронной картотеки лиц/имен/дней рождений путем перевода ее в бумажный формат. И без того гипертрофированный интерфейс настроек печати дополнен в «девятке» готовыми шаблонами расположения фотографий на странице - Print Layout (рис. 3). Снимки всех размеров и форматов выстраиваются в матрицу лиц и автоматически сопровождаются строчками ранее присвоенных значений метаданных - именем, фамилией, датой рождения. Кириллические шрифты поддерживаются в полном объеме.
   Опыт создания картотеки студентов силами самих же студентов показывает целесообразность использования еще одного малозаметного нововведения - команды редактирования Shadows\Highlights. Ведь автопортреты, сделанные мобильником в условиях осеннего освещения задних парт аудитории с окнами, выходящими на север, ужасны (поэтому, а также по соображениям приватности на иллюстрациях приведены другие портреты). Для улучшения снимков достаточно освоить опцию Adding light to shadows - проработка теней, или «голодное проявление», как сказали бы фотографы «черно-белых времен».
   Да, чуть не забыл, все вышеописанное можно делать на работе не стесняясь коллег - в программу добавлена «секретная папка» с секретным входом только из ACDSee (File\Add to Private Folder) - собранная картотека будет доступна только вам или никому, когда запомните все лица, но забудете пароль.
   В заключение отмечу ребрендинг иконки ACDSee - теперь на рабочем столе сияет золотой фотоаппарат вместо некогда золотого глаза, в котором каждый видел соринку. Наверное, это символическое отражение последнего по упоминанию, но не по значению новшества программы - функции QuickView. Двойной щелчок мышью в окне «Проводника» на иконке графического файла, сопоставленного с ACDSee, приводит к показу содержимого с неуловимой глазом быстротой.
   По мнению Штирлица, лучше всего запоминается последняя фраза. Поэтому закончим так: человеку не нужна ACDSee, человеку нужен человек… и ради этого стоит разобраться в ACDSee.
 

Софтерринки

 
    Автор: Илья Шпаньков
    DVD-Cloner III
   ОС Windows
   Адрес www.dvd-cloner.com
   Версия 3.40
   Размер 3,3 Мбайт
   Интерфейс английский
   Цена $59,95
   Ознакомительный период 30 дней
   DVD-Cloner III наверняка пригодится тем, кто часто копирует DVD-диски. С помощью этой утилиты можно не только делать идентичные клоны, но и вносить изменения в содержимое диска, отключая, к примеру, неиспользуемые субтитры или перевод, записывать на копию лишь избранные эпизоды, создавать индивидуальную комбинацию данных из материала, представленного на оригинале. Новая версия программы умеет «обходить» проблемы с региональными кодами дисков, а также сжимать данные с регулируемым коэффициентом.
 
GenealogMap
 
   ОС Windows
   Адрес www.bondarsoft.ru
   Версия 4.0
   Размер 2,2 Мбайт
   Интерфейс русский
   Цена 700 руб.
   Ознакомительный период 30 дней
   Программа GenealogMap поможет вести скрупулезный учет родственных связей своей семьи, представляя генеалогическое древо в виде интерактивной карты. Работа с нею аналогична просмотру веб-сайтов, а имитация трехмерности позволяет легко ориентироваться в солидных объемах информации. Помимо данных о своей родне, пользователь может заводить дополнительные карты для сокурсников, знакомых и друзей, при этом остается возможность быстро перемещаться между множеством карт благодаря наглядной системе выделения важных данных. К любому объекту карты можно привязать фотографию или ссылку на веб-ресурс.
 
RadioClicker Professional
 
   ОС Windows
   Адрес radioclicker.com
   Версия 6.02.1
   Размер 1,9 Мбайт
   Интерфейс русский
   Цена $6
   Ознакомительный период -
   RadioClicker Professional не позволит отстать от реалий окружающего мира даже самым заядлым любителям сетевой жизни. Это приложение предназначено для прослушивания телевизионных и радиостанций, вещающих через Интернет. По умолчанию в базе программы находится список почти всех станций, вещающих на русском языке, в том числе из ближнего и дальнего зарубежья. Для полноценной работы требуются .NET Framework 2.0 и Windows Media Player версии 9 и выше. Помимо платной Pro-версии, разработчики предоставляют бесплатную RadioClicker Lite, в которой имеется лишь базовый набор станций и несколько урезаны настройки.
 
FreeDOS
 
   ОС входит в комплект
   Адрес www.freedos.org
   Версия 1.0
   Размер 5,7 Мбайт (базовый дистрибутив)
   Интерфейс английский
   Цена бесплатно
   Лицензия GPL v2
 
   FreeDOS - плод двенадцатилетних усилий сообщества программистов, поставивших своей целью создать свободную ОС, полностью совместимую с MS DOS. В качестве применений этой не слишком революционной операционки разработчики называют запуск старых добрых игрушек и бизнес-приложений, которые невозможно заменить аналогами, а также использование во встраиваемых системах. Из возможностей ОС отметим поддержку FAT32 и больших дисков, а из доступных приложений - mp3- и ogg-плейер, текстовые редакторы, современные архиваторы и множество консольных утилит, портированных из Linux.
 

ТЕМА НОМЕРА: Не улыбайтесь, это не поможет

 
    Автор: Владимир Николаевич
    Любители фантастики давно знают, что в будущем техника сможет узнавать нас в лицо. Не раз нам рассказывали и показывали, как всевидящие системы наблюдения выслеживают человека, бегающего по городу и прячущегося в толпе мирных обывателей. Мы уверены, что это будет в прекрасном далёко. А в настоящем, как думает всякий пытавшийся распознать компьютерной программой полуслепой текст, автоматическое опознание по лицу не грозит нам еще лет …надцать.
   Однако иногда будущее оказывается ближе, чем кажется. Представьте, что уже создана, испытана и признана очень надежной система, действительно способная различать лица. При этом не нужно совать голову в специальный ящик и задерживать дыхание - человек вообще не замечает, что его «узнали в лицо». И создатели утверждают, что их система не путает даже однояйцевых близнецов. Не слабо? Об обработке толпы, снующей по аэропорту, речь пока не идет - для опознания человек должен повернуть лицо в сторону камеры и приблизиться на один метр.
 
 
   Первое и главное отличие разработки от конкурирующих систем в том, что она анализирует не двухмерный снимок (плоскую фотографию), а трехмерную модель. Представьте слепки лица, снимаемые с помощью мокрого гипса, и вы поймете, с чем работает A4Vision (www.a4vision.com). Естественно, компьютерной системе нужны виртуальные «слепки», для получения которых требуется некий объемный сканер. Основной аппаратный модуль A4Vision прямо так и называется - Vision Access 3D Face Reader, однако способ, которым он получает трехмерную поверхность, совсем не прямолинеен.
   В A4Vision решили применить сканирование с помощью (внимание) «проецирования на объект светового шаблона с заранее известной пространственной структурой». Звучит непонятно, но по сути просто и даже изящно. Вспомните, как выглядят лица людей, освещенные через жалюзи. Полосы света и тени, изначально одинаково ровные, прихотливо искажаются на лице (и вообще любом предмете). Понятно, что вся сложная поверхность лица искажает световую «зебру» точно в соответствии со своей формой. Так же понятно, что эту форму (лица или надкусанной груши) можно вычислить, сравнивая разницу между ровными полосами и деформированными. Точность реконструированной 3D-модели будет зависеть, главным образом, от разрешения полосок жалюзи - чем тоньше-гуще, тем лучше. Очевидно, что вместо параллельных полос лучше освещать предмет решеткой линий, может быть даже не с квадратными ячейками, а треугольными. Впрочем, в описании одного из первых своих патентов, стоявшие у истоков разработок бауманцы Артем Юхин и Андрей Климов указывают, что «подсветка объекта формируется в виде апериодической системы полос».
   Алгоритмы подобной реконструкции - дистанционной, точной и дешевой, Юхин хорошо изучил во время учебы в «Бауманке». Вполне естественно, что после университета он попытался их внедрить, одновременно серьезно усовершенствовав. Как далеко зашло это совершенство - уже секрет фирмы A4Vision, но ее представители действительно заявляют - точность съемки достигает долей миллиметра и позволяет различать однояйцевых близнецов!
 
История компании
 
   Один из основателей компании, Артем Юхин стал бизнесменом, как только получил паспорт, создав в 1992 году первую в Москве фирму по компьютерному дизайну интерьеров. Хотя дела шли успешно, через несколько лет он решил получить высшее образование и поступил в «Бауманку» на факультет «Радиоэлектроника и лазерная техника». В университете Юхин познакомился с Климовым, разрабатывавшим математический «предсказатель» котировок акций на бирже, и друзья решили довести его до готового продукта. Однако в 1998 году, когда уже был найден первый покупатель, случился августовский дефолт, и биржевые игры резко потеряли привлекательность.
   Тогда друзья решили взяться за дипломную работу Юхина - трехмерное распознавание лиц, и сделать на ее основе объемный фотоаппарат, быстро выдающий виртуальные «слепки» снятых объектов. В 1999 году у них уже было «устройство для бесконтактного контроля и распознавания поверхностей трехмерных объектов» (это цитата из заявки на Патент РФ) и, доработав его до изделия, которое можно было показывать инвесторам, они решили действовать по инструкции для начинающих стартапов - составили список подходящих венчурных фондов и на свои деньги стали летать по миру, убеждая вложить капитал в свое ноу-хау. К счастью, разработка оказалась удивительно демонстративной - быстрое создание виртуальных «слепков» было легко показывать, и российский «сканер» застревал в памяти многих инвесторов (сохранилась страничка проекта на сайте бауманского университета)…
   Через год, когда свои и занятые деньги заканчивались, у друзей было три предложения от разных венчурных фондов. После долгих колебаний был выбран европейский фонд MyQube, дававший наибольшую свободу действий. Документы были подписаны, а через несколько месяцев пузырь «интернет-экономики» громко лопнул - новорожденная A4Vision оказалась последним стартапом фонда. В тот момент к ним примкнула Келли Ричдейл (Kelly Richdale), внеся свой большой вклад в дальнейшее развитие бизнеса. Покупателями своего сканера они видели в первую очередь доткомы - сетевые магазины и разного рода галереи, которые должны были быть заинтересованы в создании (а затем показе на веб-сайтах) 3D-каталогов своих товаров. Расчет не оправдался, и вместо потока заказов доткомы сообщали о своей ликвидации.
   В новых условиях решили изменить направление разработок. Биометрия была еще не в фаворе, поэтому попытались сделать приложение для пластической хирургии - субмиллиметровая точность «слепков» должна была привлечь хирургов, правящих носы и прочие части тела богатым клиентам. Хотя идея казалась вполне разумной, но и для нее покупателей не нашлось. Но им удалось заинтересовать гигантскую Logitech идеей автоматической фокусировки ее веб-камер на лице человека. В результате, A4Vision сделала программный продукт, который успешно начал продаваться, и Logitech стал первым стратегическим инвестором. А затем наступило 11 сентября 2001 года…
 
   Скажем сразу, что сам по себе метод «сканирования с помощью проецирования шаблона» изобретен давно. Он хорошо известен среди специалистов и даже имеет историю успешного применения. В самом начале 90-х автору этих строк попалась фотография поросенка, освещенного сверху десятком ярких световых полос - это была разработка британских ученых, создавших систему быстрого и бесконтактного измерения свиней. Вроде бы в этом нуждались английские фермеры, но свиньи (чуя истинную цель затеи) отказывались сотрудничать, поэтому пришлось изобретать способ измерения объекта без его ведома. В конце концов установка вылилась в узкий коридор с темным полом, по которому «объекты» прогонялись и освещались сверху через подобие жалюзи. Камера делала снимок «полосатой» свиньи, по которому даже тогдашние компьютеры могли рассчитать ее охват «в плечах», «в талии», «в бедрах» и т. д.
    Кстати
   Ошибки распознавания «обознался» и «не признал» тесно связаны - закручивая чувствительность системы, одновременно повышаешь и вероятность ложных тревог. На сайте A4Vision указывается: Extremely low False Rejection Rates (FRR), even when the False Acceptance Rate (FAR) is set close to zero (.0001). В популярных статьях называются цифры «одна ошибка на сотню» для «не признала своего», «одна шибка на миллион» для «приняла чужого за своего» или более скромные «одна на сто тысяч».
   Что в начале 90-х могли британские университеты, в конце 90-х смогли российские выпускники, причем лучше и дешевле - первый прототип своей системы, который демонстрировался инвесторам, был сделан из цифрового фотоаппарата Olympus, даже не «доработанного напильником». Как уже догадались проницательные читатели, процесс «сканирования» выглядел просто - объект освещался специальным источником света. Затем делался его снимок, который отправлялся в компьютер, где самое важное и трудное совершалось на программном уровне - из плоского изображения строилась трехмерная поверхность объекта. Судя по всему, строилась достаточно впечатляюще, чтобы идея получила финансирование.
   Но давайте рассмотрим, как процесс опознания по лицу проходит в готовой системе A4Vision, испытанной и уже предлагаемой покупателям. Итак, настенный прибор под названием Vision Access 3D Face Reader работает в инфракрасном спектре. Он удобнее видимого, поскольку устойчивее к посторонней засветке, не привлекает внимания и просто не слепит глаза. Главный узел прибора состоит из двух блоков - излучателя и фотоприемника, способного делать качественные снимки со скоростью десятки кадров в секунду. Иногда его называют 3D-камерой, что может ввести в заблуждение. Камера там обычная - 2D, но ее снимки преобразуются в трехмерные поверхности. Естественно, для этого излучатель «структурированной подсветки» должен быть немного в стороне от камеры - ведь если подсвечивать лицо прямо через объектив, то на снимке не будет заметно искажений световой решетки. На некоторых моделях сканера отчетливо видны два «окна», и параллакс между ними составляет около 30 см.
   Снимки, сделанные камерой, сначала обрабатываются алгоритмами первичной обработки. Компания рассказывает о них скупо, но известно, что, например, автоматически отбрасываются кадры, на которых нет человеческих лиц, а на тех, что есть, сами лица эффективно выделяются из окружающего их «шума». Слово «эффективно» значит, что эта фильтрация идет почти со скоростью съемки - десятки снимков в секунду. Это впечатляющее и важное достижение - выделение из видеопотока лица, подсвеченного световым шаблоном, прямо влияет на весь процесс опознания. Традиционные системы, работающие с плоскими снимками, проводят такое выделение с большим трудом, поскольку вынуждены работать, по сути, с комбинацией темных и светлых пятен - именно так машина «видит» обычную фотографию.
 
Новые горизонты
 
   Рынок лицевой идентификации в США (тогда еще 2D) был занят несколькими известными компаниями, которые после терактов провели активную PR-компанию своих продуктов. Их акции пошли вверх, и даже были заключены крупные контракты, но затем Пентагон провел независимые испытания, которые все системы провалили. Например, известная Visionix дала 52,5% ошибок типа «не признал» на базе всего из пятнадцати человек-добровольцев (503 неудачных попытки на 958 распознаваний), а на полевых испытаниях в аэропорту Палм-Бич ошибки типа «обозналась» составили 31,3% от общего числа тревог (1081 ложная тревога из 3455).
   В результате, когда A4Vision смогла сделать альфа-версию своего «опознавателя», сама идея face recognition была глубоко дискредитирована, и неизвестному стартапу пришлось доказывать, мол, «ваши старые большие компании ничего не умеют, а наша молодая и маленькая умеет гораздо больше их».
   На сегодняшний день главный продукт A4Vision - набор алгоритмов и технических устройств, которые крупные интеграторы систем безопасности могут встраивать в свои приложения. Крупному банку такая система может обойтись даже дешевле стандартных смарт-карт при несравнимо большей надежности.
   Меж тем своей главной целью компания видит национальные паспортные системы - самые глобальные и денежные из всех проектов идентификации. Участвовать в них самостоятельно бесполезно (слишком сильны местные лоббисты и соображения национальной безопасности), поэтому основной стратегией является наведение контактов с крупнейшими локальными интеграторами. Дела идут успешно, и вот уже алгоритмами A4Vision американцев будет опознавать Motorola, у нас - НПО «Информация», а кроме них в списке партнеров значатся Unisys, Bell, GE, Oracle, Siemens, Sagem, Samsung и прочая и прочая. А ИФ «Мехатрон» уже установил пробный аппарат на одном из контрольно-пропускных пунктов «Салаватнефтеоргсинтеза», планируя до конца года оснастить ими все проходные предприятия (www.metron.ru/ content/view/39/).