Новый интернет-бум
   После того как лопнул пузырь доткомов, казалось, что интернет-бизнес больше никогда не наберет такого же хода. Тем не менее в 2003—04 годах начался новый бурный рост, но уже не на дрожжах обещаний и надежд, а на солидном основании больших заработков на рекламе. И потребности пользователей, и инновации в Интернете теперь — настоящие.
Новые поисковые системы
   Новые короли Интернета — поисковики. Зарабатывая большие деньги на контекстной рекламе, они стали единственным входом во всемирную сеть для полумиллиарда пользователей. Однако, на мой взгляд, сами поисковые машины сейчас находятся в удручающе застывшем состоянии: релевантность поиска не растет или даже падает, пользовательский интерфейс остается на уровне 1999 года — бесконечная лента результатов поиска, где в одну кучу свалены форумы, сайты, товарные предложения, новости и, конечно, поисковый спам: бесконечные входные страницы, липовые сайты, фальшивые каталоги, платные бессмысленные ссылки… Развитие поисковиков идет экстенсивно — по пути превращения в порталы с мультисервисной моделью, новостями, товарами, богатым контентом, почтой, электронными деньгами.
   Пользователям, как мне кажется, очень нужна новая парадигма поисковой машины.
   Наиболее перспективные идеи в это области таковы:
   Структурирование результатов поиска. Чтобы облегчить выбор среди найденного, результаты нужно разбивать по темам и типам документов. Для этого необходимо вводить распознавание тематик и структуры данных при индексации веб-страниц. Хороший пример такого структурированного поиска — портал A9.com, созданный при участии Amazon.
   Специализированные поисковики. В очень многих областях интересов вместо общего поисковика лучше использовать специализированный поиск по разным сущностям (тем или иным предметным областям, товарам, блогам, сообществам, новостям). Результаты должны объединяться и структурироваться.
   Коллективный поиск. Для структуризации и организации результатов поиска можно привлекать на помощь сообщества пользователей. Такие проекты уже существуют и получают инвестиции.
   Мобильный поиск. Не будем забывать о приходе в Интернет мобильных пользователей, которых в разы больше, чем нынешних интернетчиков, — им рано или поздно потребуется голосовое общение с поисковой машиной (а значит, диалог с нею на естественном языке).
   Те, кто первыми предложат новые виды поиска и интерфейсы поисковых машин, станут новыми Деллами и Бринами. Впрочем, сейчас в отрасли интернет-поиска начинается великая битва слона с китом — Google с Microsoft[См. по этому поводу обсуждение в «КТ» # 606. — Л.Л.-М.]. Но не думаю, что через пять-семь лет победителями будут сегодняшние поисковики — скорее, ими станут новички (как не известен был Google семь лет назад). Сейчас в США и Европе в год появляются несколько десятков громких стартапов, в той или иной форме реализующих вышеперечисленные идеи поиска.
Гибридные сайты или замешивание данных (Mash-ups)
   Недавно начал бурно развиваться еще один новый вид проектов в Интернете — сервисы, создаваемые «поверх» поисковых порталов (и их сервисов), крупных магазинов, блогов за счет объединения различных типов данных. Несколько примеров: поиск людей (коллег, одноклассников) с одновременным показом их местонахождения на картах Google; разбор криминальных сводок с сайта полиции города с отметкой происшествий на тех же картах Google, что позволяет понять, насколько криминализован твой район; соединение данных об автомобильных пробках от Yahoo! с картами Google; поиск по Amazon и объединение на той же странице данных других магазинов для сравнения цен, и т. д.
   Пока этот вид бизнеса довольно рискованный, ибо зависит от доброй воли всех владельцев данных. Скажем, Google категорически против метапоисковых сервисов, использующих его результаты поиска (он даже блокирует их, если создается большой трафик), но не очень возражает против использования своих карт. Есть уже случаи блокирования со стороны Yahoo! и Google доступа с таких гибридных сайтов, замешивающих их данные. Но надо учесть, что обычно с грандами Интернета трудно договориться заранее. А вот постфактум — можно. Если ты сделал гибридный сайт, никого не спрашивая, и доказал, что можешь привлечь большую аудиторию, а главное — можешь показать, где в твоей схеме деньги для Google или MSN, то договариваться гораздо проще. Стало быть, риск есть, но выигрыш может быть громадным и быстрым — гибридные сайты зачастую привлекают миллионы посетителей моментально и без всякой раскрутки.
Машинный перевод для поисковиков и мобильников
   Машинный перевод — больная тема вот уже полвека. Несмотря на значительные вложения и затрату чудовищного количества человеко-лет в США, Европе и России, прорыва нет. Состояние отрасли всякий может увидеть на примере работы российского «ПРОМТа». В последние годы «ПРОМТ», несомненно, лучшая в мире система перевода. Но то, что эта лучшая в мире система дает на выходе, часто напоминает не очень хороший подстрочник. Сейчас компьютерные переводчики можно использовать только для выбора текста на нужную тему, для быстрого ознакомления с документацией на товар или изделие, для пролистывания сайта конкурента в Китае или Японии (ценно хотя бы то, что вместо кракозябров на экране появляется привычная латиница или кириллица). Я считаю, что традиционные «словарные» системы автоматического перевода уже восемь-десять лет находятся в идейном тупике, и из технологии перевода, основанного на словарях, выжато все возможное.
   Однако задача перевода вдруг обрела второе дыхание. Автоматические переводчики теперь нужны не только профессионалам-переводчикам, аналитикам спецслужб и библиотекарям, и это дает надежду на прорыв. Появилась новая аудитория — пользователи Интернета и мобильных устройств, которым требуется языковая прозрачность информационного пространства. Тут же возник и новый подход к решению задачи автоматического перевода — использующий, при помощи поисковых машин, «человеческие» образцы перевода. Это развитие довольно давней идеи статистического перевода, применяемой к гигантским индексам поисковиков — хранилищам текстов с удобным поиском и сравнением образцов.
   Идея поискового перевода внешне проста: поисковик, индексирующий гигантский объем данных, всегда может вычленить из него параллельные тексты (или хотя бы фразы) — образцы перевода, сделанные людьми (даже если в Сети эти образцы лежат далеко друг от друга и внешне не связаны). Сделать это можно по «похожести» — так же как поисковик определяет дубли веб-страниц на одном языке.
   Ну а сделать из образцов параллельных текстов гибкие шаблоны перевода — задача лингвистически сложная, но вполне решаемая. Вот и Google уже создает свой переводчик и даже получает за него призы[Об этой и других новых идеях в области машинного перевода см. «КТ» #608— Л. Л.-М]. Я уверен, что вскоре этим займутся и другие поисковики, например MSN. Впрочем, не факт, что преуспеют здесь именно поисковики. Скорее, их ресурсы будут текстовой базой для систем перевода, созданных разработчиками, имеющими опыт в прикладной лингвистике.
   Итак, если вспомнить про конвергенцию Интернета с мобильниками и распознавание речи, мы вплотную подходим к идее устройства, описанного в фантастических романах, — к универсальному коммуникатору, маленькой коробочке, лежащей на столе и переводящей речь разноплеменных собеседников.
Интернет-маркетинг и реклама
   В настоящее время происходит быстрый идеологический сдвиг в области интернет-рекламы. На смену традиционной баннерной и контекстной рекламе (по поисковым словам) идет контекстно-чувствительная реклама. Эта реклама способна учитывать как контекст страниц, на которых она показывается, так и контекст пользователя (его предыдущие действия и привычки поведения в Сети). Фактически на стыке традиционной интернет-рекламы и классического маркетинга возникает новое направление, я назову его управление аудиторией. Первыми, относительно простыми примерами за последние два-три года послужили системы контекстно-чувствительной рекламы наподобие Google AdSense, «АвтоКонтекста» Бегуна, РОРЕРа и подобных им. Сейчас возникают новые игроки, новые продукты и сервисы.
   Например, появляются разветвленные партнерские системы с показом на веб-страницах товарных предложений, релевантных содержанию страницы. На смену баннерам могут прийти «мини-сайты» с возможностью навигации по ним прямо на рекламной площадке, без перехода на рекламируемую веб-страницу. Следует упомянуть автоматизированные сервисы по управлению интегрированными рекламными кампаниями на аукционе eBay, в контекстных системах в поисковиках и на партнерских сайтах (с анализом эффективности, автоматическим отзывом проданных или непродающихся позиций и пр.). Сюда же относится тематическая реклама в блогах и новостных RSS-лентах; реклама в почте, привязанная к содержанию писем. Быстро развивается также анализ поведения аудитории и отдельного пользователя, с распознаванием категории пользователя по его поведению. Вместо традиционных счетчиков появляются аналитические продукты нового поколения, позволяющие контролировать не посещаемость, а полное состояние интернет-маркетинга клиента.
   Мне кажется, лицо интернет-рекламы радикально изменится за ближайшие два-три года, и тут огромный простор для инноваций.
   Я не коснулся других огромных областей для инноваций, возникающих на стыках отраслей (скажем, веб-сервисов и мобильных сервисов), — например, средств использования традиционного софта новыми способами. Каждый такой стык — бесконечная тема. Инновации возникают там, где возникают реальные потребности массы пользователей, или там, где кто-то умный придумывает для них новую потребность. А таких областей вокруг ИТ — множество.

«КТ» #588], был не слишком обстоятелен. По его мнению, всплеск в ближайшем будущем может произойти на рынке систем «индивидуальной виртуальной безопасности», к каковым относятся анонимайзеры, шифрованные почтовые службы и т. п., — навстречу волне все более широкого доступа государства и корпораций к персональным данным двинется ответная волна защиты частной жизни. Другие перспективные темы — виртуальные игровые миры, новые формы медиа. Среди задач из предложенного списка его воодушевил, да и то «совсем чуть-чуть!», интернет-маркетинг нового поколения. Для остальных технологий Вадим не видит реальных потребителей: ни людей, ни компаний, чьи проблемы эти технологии бы решали. Он скептически отнесся и к потенциалу новых подходов в задачах распознавания, понимания текста, поиска в Интернете.
   Зато Александр Галицкий (aV Galitsky Holding B.V.)[Рассказ Александра об организованном им «Тех Туре» 2004 года и вообще о судьбе хайтека в России см. в «КТ» #557], что называется, подробно раскрыл тему. Технологии поиска (но не только и не столько для Интернета), распознавание речи, технологии управления целевой аудиторией будут, как он считает, оставаться очень привлекательными для инвестора в ближайшие три-пять лет, равно как и корпоративный блоггинг (Corporate Blogging), сервисно-ориентированные архитектуры, а заодно многообещающее направление из совсем другой области — углеродные нанотрубки. В ответ на наш список технологий Александр привел свой список — примеров инновационных компаний, работающих в этих и смежных направлениях (в данном случае слово «российская» или «наша» часто означает «ведущая R&D в России»):
   новые технологии поиска: здесь интересны компании Mamma и российская Quintra визуализация данных: примером могут служить Trolltech и наш Parallel Graphics
   аггрегирование контента: стоит упомянуть authorhouse [Крупнейший из порталов для авторов, желающих самостоятельно публиковать и продвигать на рынке свои книги; неочевидная, казалось бы, бизнес-перспектива — а вот поди ж ты];
   виртуализация компьютерных ресурсов, операционных систем и ресурсов памяти (дающая доступ к «бесконечным» объемам ресурсов): отметим Vmware и российские SWsoft и Parallels;
   вопросы безопасности остаются на вершине технологического спроса: здесь стоит назвать SmartLine, ElcomSoft, "Ашманов и партнеры";
   инструменты для совместной работы (collaboration) в реальном времени: GrooveNetworks. Это очень важное направление, естественный потребитель целого ряда новых технологий ( в том числе поиска информации и управления контентом);
   инструменты и сервисы для виртуальных сообществ (сommunity): LinkedInили наш Softkey, интернет-магазин софта c очень широкими возможностями поддержания сообщества разработчиков.
   Что ж, мы ознакомились с мнением ряда активных деятелей нашего (пока еще небольшого) рынка ИТ-инноваций о том, куда следует двигаться в обозримой перспективе. Будем следить за развитием событий в отрасли — и расширять наши знания о ней.
 

Terralab.ru: Микрофишки

Принтеры Xerox Phaser 6300/6350
   цветная лазерная печать
   скорость печати в формате A4 35 стр./мин (25 стр./мин. в цвете для 6300)
   разрешение до 1200 dpi
   процессор PowerPC с тактовой частотой 800 МГц
   расширение емкости лотков до 2350 листов (опция)
   максимальная загрузка до 120 тысяч страниц в месяц
   поддержка Adobe PostScript
   цена от $1780
   Эти однопроходные принтеры оснащаются утилитой PrintingScout, которая сообщает о сбоях в печати, вызванных, например, израсходованием тонера или бумаги, а заодно помогает неискушенным пользователям графическими инструкциями по загрузке тонера, дабы не нарушать медитативный покой местного гуру (в смысле системного администратора). Другая утилита, PhaserSMART, открывает доступ к базе знаний для поиска и устранения неисправностей (вы много знаете работников, читавших хотя бы самый последний амебный хелп? да? вам повезло…), а также отображает формат и тип материала, загруженного в лотки с соответствующей специальной функцией. Доступ к принтеру и контроль его состояния может осуществляться через встроенный веб-сервер CentreWare IS (и он же отвечает за отправку почтовых уведомлений о том, что кончается тонер).
Принтеры Xerox Phaser 8500/8550
   печать твердыми полимерными чернилами
   скорость до 24/30 стр./мин.
   вывод первой страницы за 5 с (8550)
   разрешение до 2400 dpi
   600-МГц процессор PowerPC
   лотки объемом до 1675 листов
   максимальная загрузка до 85 тысяч листов в месяц
   поддержка Adobe PostScript
   цена от $900
   Два других принтера, представленных компанией «Ксерокс Евразия», предназначены для малых и средних рабочих групп. Принтеры поддерживают стандартное сетевое подключение и имеют встроенную систему учета работ. С ними поставляются те же утилиты, что и с 6300/6350, а также веб-сервер CentreWare. Твердочернильную печать производитель видит альтернативой лазерной технологии, позволяющей создавать более точные, плотные и глубокие отпечатки.