TheLib.Ru » Компьютерра Журнал » Журнал «Компьютерра» №38 » онлайн-чтение (стр. 3)

Хотя свои «ноу-хау» конструкторы держат в секрете, кое-какие рецепты успеха можно выведать и без промышленного шпионажа. Ясно, что кузнецами нынешних достижений стали не столько «железячники», сколько программисты, ваяющие софт для распознавания образов. Благодаря их усилиям «бегуны» не набили шишек, ставших фатальными для их предшественников. Как отозвался о триумфаторах Grand Challenge директор DARPA Тони Тезер (Tony Tether), «эти люди не просто ставят мировые рекорды, но и творят историю».
Увы, история самой гонки на этом завершена: по мнению организаторов, намеченная миссия выполнена «на все сто», так что практического смысла в аналогичных соревнованиях в дальнейшем уже не будет. Впрочем, скучать неутомимым «роботворцам», пожалуй, не придется: вполне возможно, что не за горами новые схватки под флагом DARPA. Учитывая успехи сегодняшних технологий, вряд ли кто-то возьмется предугадать, для кого выстрелит стартовый пистолет очередного ралли: для «умных» самолетов или космических кораблей.

Парад победителей

    1-е место Stanley
   Результат: 6 час. 53 мин.
   Команда: ^{Стэнфордский университет}
   Спонсоры: Volkswagen of America, Mohr, Android, Red Bull, Intel

   Нынешний триумфатор является новичком гонки DaRPa. В то время, когда боты-ветераны боролись за прошлогодний трофей, будущий чемпион еще представлял собой ничем не примечательный дизельный Volkswagen Touareg. То ли дело теперь, когда его электронные мозги состоят из семи процессоров Pentium M, на чьем попечении находится радар, лазерные дальномеры, инерционные сенсоры и стереовидеокамеры (подробности см. ^{«КТ» #593}). Чудесное преображение «золушки» стало возможным благодаря пятнадцати месяцам кропотливого труда нескольких десятков студентов и преподавателей, поднаторевших в computer science, механике, сопромате и астрономии. Несмотря на военный профиль организатора гонок, стэнфордцы видят для своего детища и вполне мирное призвание. По их убеждению, «машина, достаточно умная, чтобы управлять собой, незаменима в Соединенных Штатах, где ежегодно от автокатастроф гибнет больше 40 тысяч человек».
    2-е место Sandstorm
   Результат: 7 час. 04 мин.
   Команда: ^{Red Team, Университет Карнеги-Меллон (Питтсбург)}
   Спонсоры: Boeing, Science Applications, Caterpillar, Intel, Google

   Фаворит двух исторических гонок, так и не увенчанный регалиями, является любимым детищем команды питтсбургских робототехников. С момента прошлого забега аппаратная часть ветерана, построенного на базе 6,2-литрового дизельного грузовика HMMWV образца 1986 года, не претерпела существенных изменений. Как и прежде, она представляет собой затейливый винегрет из изделий нескольких десятков компаний, включая Boeing.
    3-е место H1ghlander
   Результат: 7 час. 14 мин.
   Команда и спонсоры: те же, что у Sandstorm

   Этот бот, собранный на базе армейского джипа Hummer 1999 года выпуска, появился на свет специально для участия в нынешней гонке. В его арсенале - семь лазерных сканеров и специальный бортовой компьютер от компании Caterpillar. За зрительное восприятие отвечает батарея лазеров и видеокамер на вращающейся в трех плоскостях платформе, установленной на крыше кабины. Сигналы с приборов поступают на систему из семи процессоров Pentium M, оперативно управляющую 6,5-литровым дизельным сердцем машины. Подобно собрату, этот бот выкрашен красным - в дань уважения неистовому лидеру команды, получившему прозвище за пристрастие красить свою шевелюру в огненно-рыжий цвет.
    4-е место Kat-5
   Результат: 7 час. 30 мин.
   Команда: Gray Team, Университет Тулэйн (Луизиана)
   Спонсор: The Gray Insurance Company
   Поразительный пример народной инициативы на робототехническом поприще: застрельщиками создания «именного» бота стали Майкл и Эрик Грэй, владеющие страховой компанией из Луизианы. Прознав о готовящемся соревновании со страниц журнала Popular Science, конструкторы-любители бросили клич среди знакомых инженеров и земляков-студентов, взвалив на себя бремя финансирования разработки. После года упорной работы на старте показался модифицированный Ford Escape с гибридной силовой установкой, оснащенный стереоскопическими камерами, GPS-приемниками и вдобавок еще и солнечными батареями - в качестве альтернативного источника питания. Слывший до начала состязаний «темной лошадкой», этот бот стал одним из самых ярких открытий Grand Challenge: по искреннему признанию одного из создателей, «мы едва надеялись, что он пробежит десяток километров».
    5-е место TerraMax
   Результат: 12 час. 51 мин.
   Команда: TerraMax, ^{Oshkosh Truck Corporation}
   Спонсоры: ArvinMeritor, Caterpillar, Michelin

Наряду с исследовательской компанией Rockwell Scientific и студенческой братией университетов Алабамы и итальянской Пармы к созданию этого бота приложили руку и производители грузовика, адаптировавшие его конструкцию к суровым условиям пустыни. В результате на свет появился самый массивный участник гонки, едва не дотянувший до ограничения по массе в 20 тонн. По жребию TerraMax’у пришлось стартовать одним из последних, и в пути его застали сумерки. Несмотря на уверения создателей в том, что благодаря своим сенсорам их детище прекрасно ориентируется в темноте, пробег пришлось прервать на ночь. Хотя к утру уже был известен лучший результат и стало понятно, что рассчитывать на куш не приходится, члены команды остались верны олимпийскому лозунгу «главное не победа, а участие», заставив свое детище честно отмахать всю дистанцию.

НОВОСТИ: Хочешь мира - готовься к игре

Нобелевская премия мира, присужденная Международному агентству по атомной энергии (МАГАТЭ) и лично его директору Мохаммеду эль-Барадеи (Mohamed ElBaradei) «за усилия по предотвращению использования атомной энергии в военных целях», напоминает награду находящемуся на передовой бойцу. «Присуждение премии усиливает нашу решимость в тот момент, когда перед нами лежит трудная дорога. - Слова эль-Барадеи, как видите, не дышат спокойствием почивающего на лаврах лауреата. - Это знак того, что мы должны продолжать делать то, что делаем, быть беспристрастными и непреклонными».

В борьбе с угрозой распространения ядерного оружия МАГАТЭ отведена важнейшая роль - технический контроль возможности использования топлива мирных ядерных реакторов для производства оружейного урана и плутония. Давление со стороны желающих вступить в ядерный клуб огромное. Без какой-либо санкции со стороны мирового сообщества внесли себя в список ядерных держав Индия и Пакистан, мало у кого остаются сомнения относительно наличия ядерного оружия у Израиля. Два года назад объявила о выходе из Договора о нераспространении ядерного оружия Северная Корея. Постоянные конфликты сопровождают выполнение миссии МАГАТЭ в Иране. Что ж, Агентство не всесильно, оно просто добросовестно делает свою работу, за что и отмечено наградой.

Проблемы конфликтов и сотрудничества (с позиций теории игр) живо интересуют израильтянина Роберта Ауманна (Robert J. Aumann [1]) и американца Томаса Шеллинга (Thomas C. Schelling [2]), разделивших в этом году Нобелевскую премию по экономике. Ведь войны, агрессия, страх, насилие - это то, что разрушает экономики и делает жизнь человека «одинокой, бедной, отвратительной, зверской и короткой» (Томас Гоббс). Вклад социолога Шеллинга тесно связан с развитием теории ядерного сдерживания. Он анализирует переговоры - не только в их классическом виде, но и когда, по словам ученого, «два грузовика с динамитом встречаются на дороге, достаточно широкой лишь для одного». Вот краткая иллюстрация его теории. Возьмем два государства, предъявляющих друг к другу территориальные претензии. Их противостояние имеет две ступени эскалации: военную мобилизацию и начало реальных боевых действий. Взаимная мобилизация ведет к высокой вероятности войны и служит нулевой точкой отсчета в оценке последствий того или иного разрешения ситуации. Приобретения и потери агрессора (a) и жертвы (c), прелести взаимного миролюбия (b) образуют матрицу (табл. 1), в которой одна из сторон выбирает себе строку, а другая - столбец.
Просчитывая возможные стратегии, Шеллинг, в частности, приходит к выводу, что иногда государству бывает выгодно оставить противную сторону в неведении относительно вероятности своей мобилизации. Это оказывает сдерживающее действие. Интересно, что на родине его коллеги Ауманна, в Израиле, придерживаются именно такой политики в ядерном вопросе («ядерная неоднозначность») - существование соответствующих вооружений не подтверждается и не отрицается.

***

Математик Ауманн проанализировал проблемы долгосрочной кооперации. Простейшая иллюстрация - игра «дилемма заключенных» («сознаться и выйти на свободу»), в которой матрица выгод выглядит примерно так (табл. 2). Ауманн показывает, что если в краткосрочном плане выигрывает «изменщик», то при постоянном повторении игры выгодно установление сотрудничества. Но это лишь пример, выводы Ауманна относительно стратегии игр с ненулевой суммой (где все сразу могут выиграть или проиграть) носят гораздо более обширный и глубокий характер.

Капля за каплей

   6 октября в театре «Сэндерс» Гарвардского университета случился аншлаг: здесь проходило очередное, пятнадцатое по счету награждение лауреатов Игнобелевской премии (Ignobel Prize, ^{www.improb.com/ig}), присуждаемой за самые нелепые и курьезные научные открытия. Ажиотаж, царящий вокруг Игнобелевки, учрежденной юмористическим журналом annals Of Improbable Research («Летопись невероятных исcледований»), растет с каждым годом: билеты на церемонию были раскуплены за несколько недель до начала, и опоздавшим оставалось лишь довольствоваться веб-трансляцией с места события.
   Интернетчики оценят нынешний выбор кавалера награды в области литературы: ее коллективными обладателями в кои-то веки стали нигерийские спамеры. Наряду с безвестными создателями покорившего мир прозаического жанра, члены жюри отметили и их колоритных персонажей - отставных президентов, генералов и членов их семей, чьи ярко и образно описанные злоключения кочуют по свету, выворачивая наизнанку души и кошельки. К счастью, ни один из новоиспеченных кавалеров награды на церемонии не появился, что позволило обойтись без жертв: что ни говори, а подобное творчество вызывает чересчур сильные эмоции у многих из нас.
   Влияние на умы высоких образцов искусства - тема, еще ждущая своего пытливого исследователя. Возможно, первым шажком в этом направлении станет удостоенная премии мира работа Клэр Ринд (Claire Rind) и Питера Симмонса (Peter Simmons) из университета Ньюкасла, скрупулезно замерявших активность нервных клеток у особей саранчи в момент просмотра ими «Звездных войн». Небезынтересно, кстати, какие бури разыгрываются по утрам под черепной коробкой пользователей изобретения аспирантки Массачусетского технологического института Гори Нанды (Gauri Nanda). Данный прибор под названием Clocky представляет собой будильник на колесах, умеющий надежно прятаться после того, как зазвонит, не давая разбуженному хозяину нажать на кнопку отбоя (см. ^{«КТ» #587}). Изобретательница уверяет, что при массовом производстве ее детище способно добавить к рабочему дню немало продуктивных часов на благо экономики.
   «Химическая премия» нынешнего года вручена Эдварду Касслеру и Брайану Геттельфингеру (Edward Cussler, Brian Gettelfinger) из Университета Миннесоты. Регулярно посещая студенческий бассейн, Брайан загорелся мыслью выяснить, где плывется быстрее - в воде или в сиропе. Сказано - сделано: засучив рукава, друзья приступили к осуществлению своей идеи. Первоначально в их планы входило заполнить ванну сахарным сиропом, но власти недвусмысленно намекнули исследователям, что в случае засора канализации им светит солидный штраф. Впрочем, экспериментаторы горевали недолго: высыпав в бассейн три центнера гуаровой смолы[Полимер, разбухающий в холодной воде; используется, в частности, в пищевой промышленности] и залив их водой, они пригласили в бассейн своих приятелей-пловцов и взялись за секундомер. Как доказала практика, особой разницы между водой и гелем пловец не чувствует, поскольку увеличившаяся сила трения с лихвой компенсируется возросшей силой гребка.
   Путь к научной истине порой не только тернист, но и весьма нетороплив. Лучшее доказательство тому - удостоенное премии по физике исследование, затеянное Томасом Памеллом (Thomas Pamell) из Университета Квинсленда еще в 1927 году и ныне продолжаемое его последователем Джоном Мэйнстоуном (John Mainstone). Предметом изысканий стала смола, теоретически представляющая собой жидкость, но при комнатной температуре ведущая себя как твердое тело. Для того чтобы проиллюстрировать жидкостные характеристики этой субстанции, Томас поместил ее в сосуд и с нетерпением стал ждать капель. Первая упала через восемь лет, вторая через девять… Последняя, восьмая из наблюдаемых капель упала в 2000 году, и теперь Джон с нетерпением ждет девятую.
   После раздачи слонов началась культурная программа праздника - этакое подобие КВН для служителей науки. По традиции из года в год он посвящается какой-то определенной теме; так, ныне ею стала бесконечность. В этой связи зрителям была предложена мини-опера «Count Of Infinity» («Подсчет бесконечности»), сольные партии в которой исполняла четверка нобелевских лауреатов по физике и химии минувших десятилетий. Не позабыты и игнобелевские ветераны. На сей раз отличились «птичники»: напутствие будущим лауреатам дал обладатель позапрошлогодней премии по биологии, исследователь гомосексуальной некрофилии у уток Киз Мёликер (Kees Moeliker), а в роли специально приглашенной звезды выступил Дон Физерстоун (Don Featherstone), в 1996 году снискавший награду в области искусства за свою галерею пластиковых фламинго.
   Под занавес церемонии на зрителей обрушился каскад лекций в режиме «24/7», в ходе которых лучшие американские ученые рассказывали о главном деле своей жизни. Поистине краткость - сестра таланта: отчет о работе состоял из двух частей, первая из которых была ограничена двадцатью четырьмя секундами, а вторая - семью словами. Как бы, вероятно, ускорился прогресс, если бы подобной лаконичностью отличались все научные симпозиумы…

ТЕМА НОМЕРА: Нулевая итерация

   Сегодня мы вновь обращаемся к теме ИТ-инноваций, делая попытку взглянуть на нее с двух точек зрения - разработчиков и инвесторов. От имени разработчиков мы попросили высказаться Игоря Ашманова («Ашманов и партнеры») и Игоря Агамирзяна (Microsoft). Они перечислили и кратко проанализировали ряд инновационных направлений в ИТ, на которых, по их мнению, можно ожидать стремительного роста рынка и грандиозных успехов молодых компаний.
   На основе их материалов был составлен список потенциально перспективных технологий:
    машинный перевод нового поколения;
    новые технологии поиска в Интернете;
    софт для работы с мобильным контентом;
    интернет-маркетинг нового поколения (управление аудиторией);
    распознавание речи для массовых применений;
    параллельное программирование.
   Осознавая неполноту списка и спорность каждого из пунктов, мы, тем не менее, предъявили его инвесторам и попросили их дать комментарии, а если нужно - что-нибудь добавить. Результат, полученный обработкой ответов Вадима Асадова (холдинг «НейрОК») и Александра Галицкого (AV Galitsky Holding B.V.), вы найдете в материале «Инвестодром». Это тоже список, но более подробный и с примерами компаний, уже работающих по многим из названных направлений.
   Вот так, глядишь, методом последовательных приближений, расширяя состав участников, - вдруг да и нащупаем те непостижимые точки взрывного роста. В конце концов, рынок - это то, что думают о нем его участники. Не так ли?

Победить и слона, и кита

   Этот разговор про инновации в информационных технологиях впервые зашел на одном из заседаний конференции ИТ-директоров «Русский день-2005» в Сочи. Многие участники дискуссии горячо высказывали мнение, что основные игроки рынка ИТ в России пропустили несколько волн инноваций, закоснели и стали медлительными; другие же не менее горячо это мнение отвергали. На мой взгляд, разногласия и накал страстей спорщиков объясняются просто: рынок ИТ в его классическом понимании (продажа компьютеров, сетевого оборудования, программного обеспечения) еще лет пять назад окончательно вышел из категории «растущих рынков» (несмотря на то что продажи и не думают снижаться). Инновации же возникают на растущих рынках (или сами их «под себя» создают). Работать на растущем рынке легко и приятно - палку воткни, и она расцветет, что ни сделай - рынок все простит, деньги и клиенты текут рекой. Поэтому у тех, кто видел бурный рост рынка классических ИТ в начале 90-х, возникает своего рода ностальгия по молодым и бесшабашным временам.
   Но те времена вовсе не прошли, просто сместилась область роста: продажа десктопов и «двигание коробок» с ПО действительно стагнирует, а вот на границах традиционных ИТ постоянно возникают стыки с чем-то новым, где кипят новые идеи и рождаются новые продукты, быстро развиваются новые виды бизнеса.
   Вот краткий рассказ про некоторые из них, вполне доступные традиционным компаниям из сферы ИТ (была бы только легкость на подъем).

Мобильный контент

   Сейчас чрезвычайно быстро развивается рынок мобильного контента - игр, справочников, мелодий, картинок для мобильных устройств, в первую очередь сотовых телефонов. В значительной части этот вид бизнеса прямо и цинично ориентирован на отъем родительских денег у недалеких и доверчивых подростков, впервые в истории заимевших что-то вроде карманных денег на счетах мобильных операторов. Однако на этом рынке есть место и для вполне этичных услуг.
   Вот простой пример конвергенции традиционного ИТ-бизнеса и мобильных технологий: известная российская компания «Парагон» разрабатывает и продает многочисленные и многоязычные словари для мобильных устройств. Словари лицензируются у традиционных ИТ-разработчиков («МедиаЛингва», ABBYY), издателей (Berlitz) и др. и превращаются в словари для бесчисленного множества модификаций мобильных устройств, от наладонников и смартфонов до дешевых мобильных телефонов. Это довольно перспективный бизнес, созданный за счет объединения давно известных идей в нечто новое. Для этого «Парагону» пришлось создать мощную программистскую фабрику, способную три-четыре раза в год легко переходить на новую ОС или платформу - дело, невиданное в традиционных ИТ.
   Большой спрос в мобильном мире также на энциклопедии и справочники - довольно неожиданный после краткого взлета мультимедиа для ПК в середине 1990-х годов. То же касается простеньких игр, многие из которых сейчас возвращаются аж из конца 80-х и переживают второе рождение в мобильниках.
   Мобильный мир требует и нового программного обеспечения для бизнеса - пусть и примерно с теми же самыми функциями. Это еще один стык, на котором рождаются инновации. Например, компания «ДИСКо» в прошлом году выпустила продукт «ДИСКаунт» для учета продаж на наладонном компьютере. Это принципиально иная задача, нежели решаемая, скажем, «1С:Торговлей» для настольного компьютера (хотя «1С» один из продавцов этого продукта). Аудитория тоже иная - малый (скорее даже мелкий) бизнес, на уровне лотка или палатки на Горбушке
   Лидер в категории «мобильный офис» пока не появился. Соответственно, нет и общего стандарта, хотя он всем очень нужен. Кто его разработает и внедрит, тот будет монополистом (боюсь, им опять окажется Microsoft).

Искусственный интеллект и мобильные технологии

В области ИИ обещания создать говорящих роботов, устройства распознавания речи, машинные переводчики даются уже более сорока лет, однако сделано не очень много. Мне кажется, в первую очередь потому, что у рядового потребителя не было потребности в разумном поведении бытовых устройств. Однако с проникновением ИТ, а особенно мобильников в массы эта потребность появилась.
Мобильные устройства и телефоны сейчас остро требуют внедрения технологий ИИ. В первую очередь - распознавания речи.

Распознавание речи

   Насколько удобнее было бы вводить SMS или номер абонента вслух, чем с помощью убогой клавиатуры и капризного алгоритма Т9! Не говоря уже о пользовании мобильником в автомобиле, где управлять звонками голосом гораздо удобнее и безопаснее. Но до сих пор эта проблема не решена; я не говорю об элементарных голосовых метках, которые есть во многих современных телефонах - там, по сути, распознается не речь, а звуковой паттерн, и они начинают сбоить уже при числе меток номеров более 15-20.
   Вообще же качество распознавателя определяется соотношением числа узнанных слов к допустимому числу разных дикторов. Сейчас существуют системы только двух крайних типов - множество слов для одного или нескольких дикторов (скажем, 60 тысяч слов/1 диктор) и много дикторов с несколькими десятками слов. А чтобы обслуживать массового пользователя, нужны системы для множества дикторов с множеством слов.
   Первый тип голосовых систем используется для диктовки текстов или управления компьютером, при условии тщательного обучения системы вашему голосу. Такие системы после обучения работают довольно надежно. Однако массовый пользователь никогда ничего не настраивает, никогда ничему не обучает, это известный факт. Настройки в операционной системе, текстовом редакторе или на веб-сайте поисковика меняют не более 1-2% пользователей.
   Второй тип распознавания используется для элементарных вопросо-ответных систем в центрах обслуживания абонентов, для набора номера голосом, в так называемых голосовых порталах, но тут технология работает не очень хорошо. Понятно, что системы с многими дикторами должны работать без обучения с любым диктором, и это их проклятие.
   В общем, безупречная массовая система типа, скажем, 1000/1000 или 1000/10000, то есть для многих дикторов с распознаванием нескольких сотен слов (а уж тем более фраз или слитной речи любого диктора), пока не создана. Тот, кто создаст такую систему для английского, немецкого, китайского, да и для русского языка, озолотится.
   Естественно, такие системы активно разрабатываются. На мой взгляд, тут самая обещающая идея - перейти от «сугубо технического» распознавания 90-х годов (очистка сигнала, нарезка, угадывание фонем и пр.) к распознаванию «по смыслу», по контексту, то есть к предугадыванию того, что могло бы быть сказано. Именно так распознает речь человек: без знания контекста и заранее сформированной модели ситуации мы ошибаемся в распознавании на слух абстрактных текстов не реже машины. А предугадать круг возможных реплик не слишком трудно, это и так делают при создании любого центра обработки звонков, службы технической поддержки и пр.
   Ясно, что заранее обученные контексту системы можно создавать только для ограниченного контекста, то есть для узких и хорошо описанных предметных областей (или они должны надежно распознавать предметные области и быстро переключаться между ними). Тем не менее для массовых справочных сервисов в мобильном телефоне этого было бы вполне достаточно.
   Вторая перспективная идея - отказ от попытки точно распознать всю фразу. Вместо этого нужно «ловить» в потоке непонятной речи ключевые слова и фразы - и по ним строить гипотезы о возможном содержании запроса. Это тоже близко к тому, как распознает речь человек, особенно в условиях шума, сильного акцента собеседника, большого количества неизвестных слов в его речи. Фактически нужно превратить распознаватель в поисковую машину по возможным репликам пользователя.

Виртуальные собеседники

   Рынок мобильного контента требует интеллектуальных агентов, умеющих поддерживать связный диалог - болтать в чате, осуществлять навигацию по услугам, выбирать картинки или мелодии… Из развлечения для студентов и профессоров и повода выиграть престижный, но практически бесполезный приз Лёбнера (на прохождение теста Тьюринга на «человечность») виртуальные собеседники превращаются в серьезный бизнес. Уже появляются первые «виртуальные подружки» - тамагочи в мобильнике, - требующие внимания и подарков.
   Для английского языка это сделать проще, а для немецкого или русского - гораздо сложнее. Такие стартапы сейчас то и дело появляются. Например, российская компания «Наносемантика» разрабатывает виртуальных собеседников для русского и английского языков, позволяющих вести связный диалог по SMS и в Интернете, и к ним очень большой интерес проявляют агрегаторы мобильного контента.
   Главные идеи разработки близки описанным выше для распознавания речи - нечеткое распознавание, отказ от жестких «лингвистических» шаблонов, превращение распознавателя фраз в поисковую машину по возможному контексту.