Страница:
Далее на основе снимков создается предварительная 3D-модель лица, от которой отрезается все постороннее - прическа, усы, борода, шея… В получившейся модели заполняются возможные «дыры» и проводится сглаживание. Кстати, система легко «видит» очки на лице (как выступ перед глазами) и в зависимости от настроек может попросить их снять или, вырезав из модели этот участок, попытаться обработать то, что осталось.
В конечном счете модуль первичной обработки выдает оптимизированную трехмерную поверхность, оптимально подходящую для последующего распознавания.
После первичной обработки наступает черед «извлечения антропометрических особенностей лица». Разумеется, извлекаются не все особенности, а только индивидуальные и не меняющиеся из-за болезней, диет, пластических операций и т. д.
Кстати
Любопытно, что среди законодателей глобальных технологических изменений на Западе немало предпринимателей российского происхождения - Макс Левчин (основатель PayPal) и Сергей Брин (основатель Google), Алек Милославский (основатель Genesys) и Александр Степанов из Adobe…
По словам представителей компании, независимые испытания показали, что точность лицевой 3D-идентификации по ряду параметров превосходит точность идентификации по отпечатку пальца, который подделать несравнимо легче, чем лицо. Конечно, если сравнивать с идентификацией всех пяти пальцев, пока не превзойденной никакими другими системами (кроме ДНК), включая сканер радужки глаза, то возможности системы все же имеют ограничения по размеру базы. Поэтому, по данным НПО «Информация» (www.npo-inform.com), лучше применять комбинированный метод с использованием трехмерной технологии от компании A4Vision и двухмерной системы распознавания, обеспечивающей достаточную точность в режиме идентификации при базах данных размером до 10 000 лиц, а в перспективе - до 100 000 человек…".
Чтобы понять, как это возможно, снова сделаем отступление. Был такой ученый - Герасимов Михаил Михайлович (1907-70), российский антрополог, археолог и скульптор, доктор исторических наук. В историю он вошел, главным образом, как создатель метода восстановления облика людей по костным останкам. Наибольшую известность получило восстановление лиц по найденным черепам - читатели наверняка видели такие ролики по ТВ. Герасимов доказал, что форма отдельных частей лица (носа, рта, глаз и ушей) очень жестко зависит от величины и формы частей черепа - носовых костей, строения и ширины зубной дуги, формы и величины зубов, прикуса, особенностей нижней челюсти, формы глазниц, их глубины и т. д. Он создал метод, так и называемый «метод Герасимова», по которому археолог, нашедший череп, может весьма точно воссоздать лицо его обладателя. Если добавить к этому лицу вероятную прическу и «раскрыть глаза» (рукой художника), то получится почти прижизненный портрет.
Сейчас этот метод компьютеризован, им широко пользуются криминалисты всех стран, но для нас важно другое. Программисты A4Vision решили применить его, образно выражаясь, в обратную сторону! Имея в распоряжении очищенную от шумов, точную до десятых долей миллиметра, трехмерную модель лица, они поняли, что могут обработать ее своего рода перевернутыми процедурами Герасимова, и выявить, в конце концов, часть черепа отснятого человека! А получив данные о костях, программа уже может выделить точки (не столько лица, сколько черепа), соотношение которых уникально для каждого человека и не зависит от диеты, болезней, возраста и т. д. Выделить, даже если перед объективом было лицо с ожирением, эмоциями и следами хирургического лезвия.
Среди прочего известно, что сканеры A4Vision определяют лицевой угол человека. Это угол между глазнично-ушной горизонталью и линией, соединяющей верхненосовую точку и простион (самую переднюю точку альвеолярного края верхней челюсти). Измерением этих же углов занимались энтузиасты расовой чистоты в нацистской Германии, по голове определяя специальной линейкой, кто ариец, а кто недочеловек.
По завершении всех процедур анализа формируется так называемый «биометрический шаблон» - очень маленький файл, описывающий уникальную геометрию конкретной физиономии. Именно этот шаблон помещается в базу данных, записывается в электронные пропуска и сравнивается с другими шаблонами.
Достижения
В ноябре 2002 года журнал Biometric technologies today назвал технологию A4Vision самой передовой на рынке, а в июне 2004-го консалтинговая компания Frost amp;Sullivan, выдающая нечто вроде «технологических Оскаров», назвала ее лучшим биометрическим продуктом года (раньше никакая российская технология этот «Оскар» не получала). Затем стартовали первые пилотные проекты (аэропорт Милана, Royal Bank of Scotland и др.).
А биометрический турникет от компании НПО «Информация» назван «Лучшим инновационным продуктом» 12 -ой Московской международной выставки «Охрана, безопасность и противопожарная защита - MIPS 2006» в номинации «Системы ограничения доступа». Выставка проходила в Москве с 4 по 7 апреля 2006 года. Компания НПО «Информация» представила на выставке новейшие разработки в области биометрических и интеллектуальных систем безопасности.
«Скорострельность» всего комплекса позволяет за секунду провести несколько полных циклов идентификации «съемка-моделирование-проверка по базе», фактически выполнив несколько независимых опознаний одного лица. Тонким моментом является размер самой базы данных. Пока эти сканеры работают в фирмах-банках, где число введенных в аппарат биошаблонов исчисляется сотнями (максимум - тысячами), то проверки действительно не превышают секунды. На сайте самой A4Vision в спецификациях приборов пишут о «Processing speeds of 10-12 full capturing-matching cycles per second» (за секунду происходит 10-12 циклов «захвата-сравнения» изображения ). Человек все время слегка крутит головой, меняя мимику, и постоянная съемка этих микродвижений позволяет сканеру выбрать оптимальный ракурс. Такой метод - непрерывного распознавания, сильно улучшает главную характеристику любой системы идентификации - вероятность ошибок «обознался» и «не признал».
«Биометрический шаблон» лица, получаемый A4Vision в конце моделирования и анализа, удивительно компактен - по разным данным, от трех до шести килобайт в запакованном виде. В этом смысле он похож на файл с векторной графикой, который хранит лишь узловые точки своей картинки и данные, линиями какой кривизны их надо соединять. В результате, векторные картинки занимают мало места на диске, а биометрический шаблон лица можно записать даже в дешевые RFID-чипы.
Надежность системы A4Vision в реальных условиях была несколько раз проверена сначала американскими госструктурами, а затем спецслужбами других стран. Благодаря ей в мировой обиход вошел термин «трехмерное распознавание лица», и сейчас под распознаванием лиц по умолчанию понимается именно объемная (а не плоско-фотографическая) биометрика. Более того - формат данных о трехмерной поверхности лица, который представляет собой шаблон A4Vision, судя по всему, будет принят в качестве открытого международного стандарта (как MPEG или HTML). По крайней мере, черновой вариант соответствующей поправки к ISO/IEC 19794-5 (стандарт биометрии) был утвержден в январе нынешнего года одним из подкомитетов при ISO [По данным пресс-релиза www.npo-inform.com/news/kioto-2006]. Эта стандартизация, если ее утвердят, позволит хранить в паспортах и базах разных стран шаблоны единого формата, «понимаемые» всеми системами лицевого опознания. Для A4Vision это будет Успех с большой буквы, ради которого ей, кстати, уже пришлось раскрыть внутреннюю структуру шаблона. Это позволяет конкурентам начать разработку сходных и совместимых устройств идентификации, но, по мнению самой компании, у нее есть фора в несколько лет узкоспециальных разработок и большие связи с интеграторами.
Несмотря на «мировое признание», работы по исследованию и программированию американско-швейцарско-российская A4Vision по-прежнему ведет в России, а офисы компании расположены в Калифорнии, Женеве и Москве.
Особое мнение
Надо заметить, что предмет статьи вызывает двойственное отношение. С одной стороны, очень здорово, что «наши добились успеха», причем головой и даже не переставая быть нашими. С другой, несмотря на радужные оценки экспертов, широкая поступь прогресса как-то не вызывает прилива энтузиазма. И дело тут не в преувеличенных достоинствах - они вполне обоснованны. Когда разработчики говорят, что сделать маску чужого лица с субмиллиметровой точностью очень трудно, а маску, носимую поверх своего лица, - еще труднее, в это веришь. Чтобы опознать кого бы то ни было, система идентификации должна хранить его данные в своей базе. Для разработки A4Vision это значит, что нужно создать биометрический шаблон, подведя человека к сканеру секунд на десять и попросив выполнить ряд инструкций. Создать шаблон по описаниям свидетелей или кадрам телесъемки - нельзя. Поэтому, если Бен Ладен сделает себе курносый нос и, сбрив бороду, решит провести старость среди флоридских пенсионеров, трехмерные лицевые сканеры в аэропортах США его не узнают. Тем более они не узнают любителей позировать перед камерами в балахонах на голове и оружием в руках. А вот граждан, прошедших процедуры регистрации, занесенных в базы данных и позже объявленных в розыск, такими приборами можно будет отлавливать эффективно. Кажется, даже инъекции спазмогенов, а-ля Том Круз в «Особом мнении», окажутся бесполезны.
Лицевое опознание может очень легко стать обязательной процедурой, и всякий, уклоняющийся от него, будет сразу помечаться системой как подозреваемый. На пульте наблюдателя (например, за подземным переходом) будет зажигаться сигнал «Опасность! Неопознанный объект!», а на мониторах наблюдения такой человек будет отмечаться в толпе красной рамкой (а то и перекрестьем прицела).
Ситуация начнет напоминать отношения к паспортам. Сейчас этот документ в принципе не обязательно носить с собой, но чем дальше, тем больше людей его держат при себе. Иначе при задержании патрулем человеку без паспорта (или иного документа) говорят «Пройдемте в отделение» и надевают наручники. С лицевым опознанием во многих местах (в том числе и публичных) может произойти то же самое - или позволяешь себя точно опознать при входе в универмаг или автобус, или становишься подозреваемым (с вытекающим поражением в правах). В деле безопасности это, может, и хорошо, но в тех же универмагах такое опознание станет для маркетологов еще одним орудием выкачивания денег (вспомните рекламные щиты в «Особом мнении», узнающие людей и показывающие им персональные ролики).
A4Vision создала уникальный сканер, узнающий людей независимо от их движения (снимок делается слишком быстро), устойчивый к гримасам, поворотам головы до тридцати градусов (влево-вправо) и безразличный к освещению. Он может работать в полной темноте - камера все равно отсекает видимый свет, снимая только ИК-подсветку. Сейчас компания работает над «дальнобойным» вариантом, способным узнавать людей с десяти метров, а затем и в толпе. Не знаю, как вам, а мне упорно вспоминаются подопечные английских фермеров, прогоняемые через темный коридор.
История компании
Один из основателей компании, Артем Юхин стал бизнесменом, как только получил паспорт, создав в 1992 году первую в Москве фирму по компьютерному дизайну интерьеров. Хотя дела шли успешно, через несколько лет он решил получить высшее образование и поступил в «Бауманку» на факультет «Радиоэлектроника и лазерная техника». В университете Юхин познакомился с Климовым, разрабатывавшим математический «предсказатель» котировок акций на бирже, и друзья решили довести его до готового продукта. Однако в 1998 году, когда уже был найден первый покупатель, случился августовский дефолт, и биржевые игры резко потеряли привлекательность.
Тогда друзья решили взяться за дипломную работу Юхина - трехмерное распознавание лиц, и сделать на ее основе объемный фотоаппарат, быстро выдающий виртуальные «слепки» снятых объектов. В 1999 году у них уже было «устройство для бесконтактного контроля и распознавания поверхностей трехмерных объектов» (это цитата из заявки на Патент РФ) и, доработав его до изделия, которое можно было показывать инвесторам, они решили действовать по инструкции для начинающих стартапов - составили список подходящих венчурных фондов и на свои деньги стали летать по миру, убеждая вложить капитал в свое ноу-хау. К счастью, разработка оказалась удивительно демонстративной - быстрое создание виртуальных «слепков» было легко показывать, и российский «сканер» застревал в памяти многих инвесторов (сохранилась страничка проекта на сайте бауманского университета)…
Через год, когда свои и занятые деньги заканчивались, у друзей было три предложения от разных венчурных фондов. После долгих колебаний был выбран европейский фонд MyQube, дававший наибольшую свободу действий. Документы были подписаны, а через несколько месяцев пузырь «интернет-экономики» громко лопнул - новорожденная A4Vision оказалась последним стартапом фонда. В тот момент к ним примкнула Келли Ричдейл (Kelly Richdale), внеся свой большой вклад в дальнейшее развитие бизнеса. Покупателями своего сканера они видели в первую очередь доткомы - сетевые магазины и разного рода галереи, которые должны были быть заинтересованы в создании (а затем показе на веб-сайтах) 3D-каталогов своих товаров. Расчет не оправдался, и вместо потока заказов доткомы сообщали о своей ликвидации.
В новых условиях решили изменить направление разработок. Биометрия была еще не в фаворе, поэтому попытались сделать приложение для пластической хирургии - субмиллиметровая точность «слепков» должна была привлечь хирургов, правящих носы и прочие части тела богатым клиентам. Хотя идея казалась вполне разумной, но и для нее покупателей не нашлось. Но им удалось заинтересовать гигантскую Logitech идеей автоматической фокусировки ее веб-камер на лице человека. В результате, A4Vision сделала программный продукт, который успешно начал продаваться, и Logitech стал первым стратегическим инвестором. А затем наступило 11 сентября 2001 года…
Комментарий специалиста
Данные о результатах независимого тестирования имеются, опубликованы: было проведено тестирование в Сингапуре на более чем 1 тысяче человек и в Великобритании ( в лабораторных условиях - около 200 человек). Имеются прямые ссылки на эти результаты тестирования.
Заявление об отсутствии стандартов также недостоверно, так как американский стандарт на эту биометрику уже есть, а международный разрабатывается и будет действовать примерно через год.
Сергей Дорофеев,
гендиректор российского представительства A4Vision
Новые горизонты
Рынок лицевой идентификации в США (тогда еще 2D) был занят несколькими известными компаниями, которые после терактов провели активную PR-компанию своих продуктов. Их акции пошли вверх, и даже были заключены крупные контракты, но затем Пентагон провел независимые испытания, которые все системы провалили. Например, известная Visionix дала 52,5% ошибок типа «не признал» на базе всего из пятнадцати человек-добровольцев (503 неудачных попытки на 958 распознаваний), а на полевых испытаниях в аэропорту Палм-Бич ошибки типа «обозналась» составили 31,3% от общего числа тревог (1081 ложная тревога из 3455).
В результате, когда A4Vision смогла сделать альфа-версию своего «опознавателя», сама идея face recognition была глубоко дискредитирована, и неизвестному стартапу пришлось доказывать, мол, «ваши старые большие компании ничего не умеют, а наша молодая и маленькая умеет гораздо больше их».
На сегодняшний день главный продукт A4Vision - набор алгоритмов и технических устройств, которые крупные интеграторы систем безопасности могут встраивать в свои приложения. Крупному банку такая система может обойтись даже дешевле стандартных смарт-карт при несравнимо большей надежности.
Меж тем своей главной целью компания видит национальные паспортные системы - самые глобальные и денежные из всех проектов идентификации. Участвовать в них самостоятельно бесполезно (слишком сильны местные лоббисты и соображения национальной безопасности), поэтому основной стратегией является наведение контактов с крупнейшими локальными интеграторами. Дела идут успешно, и вот уже алгоритмами A4Vision американцев будет опознавать Motorola, у нас - НПО «Информация», а кроме них в списке партнеров значатся Unisys, Bell, GE, Oracle, Siemens, Sagem, Samsung и прочая и прочая. А ИФ «Мехатрон» уже установил пробный аппарат на одном из контрольно-пропускных пунктов «Салаватнефтеоргсинтеза», планируя до конца года оснастить ими все проходные предприятия.
Комментарий специалиста
В целом, технология 3D-распознавания лица безусловно интересна и перспективна. К ее несомненным преимуществам следует отнести удобство использования. Но у «инновационности» и «перспективности» имеется обратная сторона. Технология, ввиду своей сравнительной новизны, пока не протестирована признанными независимыми международными институтами, такими как NIST на больших массивах информации (миллионы записей). Впрочем, заявки на такое тестирование A4Vision уже подала, так что скоро появится возможность сравнить качество поиска с лидерами 2D. В настоящий момент, есть разные мнения относительно перспектив 3D-распознавания.
Однако учитывая организационный и инженерный талант, амбициозность и очевидный творческий потенциал людей, «двигающих» 3D-распознавание в A4Vision, можно предположить, что 3D-распознавание не затеряется среди альтернативных биометрических технологий и будет развиваться несмотря на описанные препятствия.
Андрей Соловьев,
генеральный директор компании «Сонда»
ОГОРОД КОЗЛОВСКОГО: Красота - страшная сила!
Автор: Козловский Евгений
High Definition Video, или, по-отчасти-русски, Видео Высокой Четкости, вроде бы приближается и надвигается. Но как-то ужасно нестройными рядами. То откладывается выпуск очередного (первого?) Blu-ray-проигрывателя, то кто-то отказывается совмещать в своем заявленном проигрывателе стандарты Blu-ray и HD DVD, а кто-то, напротив, говорит, что непременно будут оба… Где-то проскальзывает новость о выпуске емких болванок, но писать на них можно будет только собственные данные, а вот как Голливуд впишется в новый формат, когда и всеми ли сразу студиями - дело, дескать, пока темное… Не могу сказать, что в этой ситуации есть что-то необычное: с DVD в свое время происходило нечто похожее, хоть, может, и не столь… многослойное, - но в конце концов все как-то утанцевалось.
Однако народ уже поманили морковкой на удочке, народу уже хочется (а там, за буграми, народ уже хавает эту морковку вовсю: по кабелю и спутниковому телеэфиру! да и нам НТВ+ обещает; отдельный разговор, намного ли народ стал счастливее, но, будучи сторонниками технического прогресса, давайте считать, что намного!), - а нормальных легальных (или копирующих легальные пиратских) дисков с фильмами, а умеющих их проигрывать проигрывателей, - всего этого (ничего этого), можно сказать, как не было, так и нет. Сдвиг разве что произошел в области дисплеев: появились первые подлинно HD (с разрешением 1920х1080, правда - 1080i, - но 1080p, похоже, нам с Европой не грозит, только Штатам), причем по вполне нормальной для таких больших дисплеев цене, я бы даже сказал - неожиданно низкой [Взять, к примеру, не так давно попробованный и описанныймною в «Огороде» «С кепкой - метр» тридцатисемидюймовый жидкокристаллический телевизор от Acer - AT3705] , да две-три модели тоже не заоблачно стоящих HD-видеокамер. Примеры - увы, уже снятая с производства HDR-HC1 от Sony («Огород» " High Definition"), которую, правда, заменила следующая модель, HDR-HC3 - подешевле, но и попримитивнее, - и - одно из немногих ярких впечатлений минувшего CeBIT’а - семисотдолларовая Sanyo VPC-HD1, разрешение которой при 30 кадрах в секунду чуть поменьше, чем у «сонек», - 1280х720; правда, 720 - это 720p, а 1280 точек - это 1280 честных точек, а совсем не 1440 сониевских (то есть прописанных в HDV, чтобы поток не превысил), которые потом растягиваютсяна 1920.
Но еще появилось - прямо вот у нас! - больше тысячи фильмов в разрешении HD, обычно снятых с HD-каналов счастливчиков американцев/канадцев/австралийцев и записанных попросту как MPEG2-файлы на DVD-болванки [ магазинчиках, которые торгуют у нас HD-фильмами, и о самих фильмах я написал дважды: в уже упомянутом «Огороде» «С кепкой - метр» и в следующем за ним " Мегапикселы и килогерцы"]. Они вполне доступны (во всяком случае, энтузиастам) и по цене, и по физической достижимости, и их хочется прямо сейчас брать и смотреть.
На чем? Можно на компьютере. Если у вас стоит приличного качества ЭЛТ-монитор (ЖК-мониторы с разрешением 1920х1080 пока, согласитесь, все-таки экзотика; ну разве что взять телевизор вроде вышеупомянутого AT3705 и использовать в том числе как монитор) и мало-мальски приличная же видеокарта, - вполне реально выставить разрешение в 1920х1440. Другой разговор, что вряд ли каждой логической точке будет соответствовать физическая точка экрана, которая, скорее всего, окажется покрупнее, - однако при, скажем, 19-дюймовой диагонали картинка все равно будет выглядеть весьма и весьма эффектно. Но я глубоко убежден (жизнью), что компьютер удивительно хорош как полигон для обкатки и знакомства с новыми мультимедийными технологиями, - использовать же его как развлекательный центр - убого и неправильно. Так что хочется сесть на мягкий диван против телевизора (или проекторного экрана), взять в руки «лентяйку» и…
Как ни странно, инструменты для просмотра HD-видео (во всяком случае, не закодированного, в виде простых MPEG2-файлов) появились чуть ли не прежде, чем вышеупомянутые телевизоры и видеокамеры. Первое такое устройство, поддерживающее HD и имеющее компонентный видеовыход, попало мне в руки больше года назад ["Огород" " Средство для безделья: карманный вариант"]. Оно представляло собой кейсик для жесткого диска с возможностью вывода видео высокой четкости (до 1920х1080i) и с целым рядом ограничений: отсутствием «ленивой» возможности управлять проигрывателем издалека, удобно-привычным дистанционным пультиком; ограничением по потоку (почему-то - до 8 Мбит/с); невозможностью играть DVD-фильмы целиком, как есть, но только - отдельные VOB-файлы. Впрочем, откуда взялось последнее ограничение, в общем-то понятно: производители стремились насколько возможно снизить цену и решили не платить роялти за DVD-декодер. Устройство по имени AivX DVP-254 было весьма прикольным, но, конечно, не особо удобным в качестве проигрывателя. Хотя если воспринимать его главным образом как переносной винчестер, а видеовозможности - как бонус, - добавочных восьмидесяти, кажется, баксов можно было и не пожалеть.
Месяцев девять спустя, на CeBIT 2006, подобных устройств уже было пруд пруди, причем многие имели и встроенные экранчики, и дистанционные пультики, и всякие прочие навески, которые, конечно же, повышали цену устройств, отнюдь не превращая их в полноценные домашние проигрыватели для файлового HD-видео.
Однако через пару месяцев после окончания CeBIT 2006 Андрей Ряхин из «Стоика» принес мне домой описанный в дважды упомянутом выше «Огороде» «С кепкой - метр» Net DVD Cinema SnaZio* - полноценный и в традиционном для бытовых проигрывателей форм-факторе проигрыватель, поддерживающий HD-видео без ограничения по потоку (во всяком случае, до 30 Мбит/с). Проблема отсутствия встроенного винчестера у Net DVD Cinema SnaZio* решалась наличием двух сетевых интерфейсов: Ethernet и Wi-Fi, а также встроенным DVD-приводом, который, с одной стороны, умел читать DVD-диски не только как носители DVD-видео, но и как носители данных: MPEG2- и MPEG4-файлов, музыки, разного рода картинок и всего такого прочего, с другой - естественно, позволял просматривать DVD-видео не пофайлово, а, так сказать, комплексно.
Устройство в определенных кругах покупателей неожиданно приобрело популярность, так что Андрей прямо-таки не успевал завозить его в нужных количествах, - у меня же, при почти полном отсутствии претензий к функциональности, оно оставило ощущение китайской (в плохом смысле слова) «мыльничности»: как-то неаккуратненько! И корпус слеплен, словно кузов «жигулей», - с не выведенными в нуль стыками, и экранный шрифт мелок и некрасив, и… вообще. Короче говоря, ставить такой проигрыватель на мою музыкальную стойку, к дизайнерским шедеврам от Onkyo, Pioneer и Panasonic, рука не поворачивалась. Другое дело, что, если б речь пошла об оборудовании какого-нибудь просмотрового зала (а именно этим - в применении к душанбинскому Дому Кино - я последние недели параллельно занимаюсь как консультант), спрятать в кинобудку и такое устройство - для расширения функциональности всего комплекса, - безусловно, имело смысл, и я даже задумал включить его в перечень закупаемого в Москве железа. Правда, эта «неаккуратность» сама по себе вызывала легкие сомнения в надежности устройства, но за отсутствием на рынке других вариантов я был готов - хотя бы на первое время - согласиться и на этот.