Страница:
Страница выдачи Google по умолчанию предлагает список из десяти наиболее релевантных результатов поиска. Особенность Google заключается в том, что на своей странице выдачи этот поисковик демонстрирует концепцию так называемого «универсального поиска» (Universal Search). Выполнен он по рецепту Джеймса Бонда: «смешать, но не взбалтывать». Его суть заключается в том, что набранный в Google запрос по умолчанию отправляется на все основные специализированные ресурсы поисковика, а результаты такого поиска показываются единым списком. Конечно, показывать результаты поиска картинок или видео на одной странице с результатами веб-поиска умеют большинство современных поисковиков, располагающих такими базами, однако результаты из различных баз Google показываются не отдельными блоками на странице, а выводятся единым списком, при этом позиции разнородных результатов на странице выдачи распределяются по степени общей релевантности.
Соответствующие алгоритмы пытаются определить, что важней для темы поиска: обычная веб-страница, видеоролик, новость или сообщение в блоге, что и определяет порядок следования результатов в форме выдачи.
Для каждого результата приводится заголовок найденной страницы, текстовая выдержка, адрес веб-страницы, а также ссылки на сохраненную при индексировании в кэше поисковика копию веб-страницы и тематически подобные странички. Необходимо отметить, что поиск подобных веб-страниц пока не является сильной стороной Google и здесь, как правило, можно наблюдать небольшое количество результатов, а также информационный шум.
Для изображений, включенных в «универсальный» список выдачи, приводятся только их графические миниатюры. Видеоролики сопровождаются информацией об их длительности, а также дате добавления в базу.
В нижней части страницы находится поле для поиска в найденном. Его роль – возможность уточнения запроса пользователем за счет добавления новых ключевых слов (рис. 1.2).
Рис. 1.2. Инструменты уточнения запроса Google собраны на боковой панели списка выдачи
Дополнительные инструменты уточнения запроса вынесены на боковую панель, которая содержит несколько блоков фильтров. Первый сверху блок позволяет быстро перейти к поиску в основных вертикальных базах Google. Второй блок во многом повторяет перечни фильтров формы расширенного поиска. С помощью его инструментов можно отобрать результаты, представленные на языке, установленном в браузере пользователя по умолчанию, отфильтровать ссылки по дате добавления в индекс. Если пользователь является обладателем аккаунта Google, система может разделить в списке выдачи просмотренные и еще не просмотренные им результаты.
Отдельно отметим возможность настройки внешнего вида страницы выдачи Режим Колесо обозрения делит область просмотра результатов на две части. Первая предлагает визуальную карту результатов поиска: в центре демонстрируется поступивший запрос, а вокруг располагаются дополнительные, автоматически найденные ключевые слова, способные содержательно уточнить запрос. Режим Хронология упорядочивает результаты по хронологическому признаку, при этом учитывается не дата добавления страницы в индекс, а даты событий, о которых идет речь в тексте найденных веб-страниц. Данный режим позволяет наглядно увидеть историю развития той или иной темы. Для этого служит выводимая над результатами поиска «линия времени», разделенная на отрезки по 5 лет. Щелкнув на определенном делении, можно открыть результаты, текст которых относится только к этому отрезку времени.
Дополнительные варианты настройки есть и у стандартного режима просмотра. В режиме. Сайты с картинками под заголовком каждого результата поиска демонстрируются изображения, найденные на этом же сайте. В режиме. Предпросмотр страниц рядом с каждой позицией поиска выводится миниатюрный скриншот веб-страницы, что позволяет вспомнить нужный сайт по его внешнему виду.
Последней на сегодняшний день новинкой Google в области пользовательских интерфейсов стал режим «Живой поиск». Он включается автоматически при достаточной скорости интернет-соединения. В этом режиме список результатов поиска загружается немедленно после ввода или изменения поискового запроса пользователем. Кроме того, рядом со ссылками появились кнопки с изображением лупы. Они открывают всплывающие панели со скриншотами выбранных страниц.
Более подробного рассказа заслуживает режим. Поиск с переводом, который работает с помощью сервиса Google Переводчик. При его активации на странице поиска появляется меню выбора языковых пар. Результаты поиска выводятся в двух колонках: на оригинальном языке и переведенные на указанный пользователем язык. Данная функция очень полезна при поиске по национальным сегментам интернета. После перехода по переведенным ссылкам переводятся и целевые веб-страницы. Система перевода Google отличается хорошей скоростью работы, поэтому серфинг в таком режиме проблем не вызывает.
Главный плюс переводческой службы Google – большое количество поддерживаемых языков. Качество перевода с основных европейских языков вполне сносное, правда, это относится только к текстам так называемой «общей» лексики. Как только происходит переход на тематические ресурсы, качество перевода заметно падает. Как бы то ни было, в большинстве случаев понять смысл текста можно (рис. 1.3).
Рис. 1.3. Режим поиска с переводом полезен при работе с национальными сегментами интернета
Система поиска новостей в Google работает с новостными сайтами и другими ресурсами, предлагающими соответствующий контент. В отличие от веб-поиска допускается сортировка результатов не только по релевантности, но и по дате публикации.
Для поиска в блогах Google не предлагает каких-либо необычных инструментов или возможностей, просто ограничивая поиск ресурсами популярных блог-платформ. А вот база «Микроблоги» интересна тем, что индексирует сообщения популярного сервиса Twitter. Сортировка результатов поиска идет по дате их публикации. Для удобства работы со списком выдачи предлагается визуальная «линия времени», демонстрирующая количество «твитов» за последний день и позволяющая быстро находить сообщения за определенный промежуток времени.
Локальный поиск Google тесно связан с картографическими сервисами, поэтому его эффективность напрямую связана с качеством покрытия картами Google той или иной территории. Наилучшее качество обеспечивается для Северной Америки. При локальном поиске в русских ресурсах достойный охват обеспечивается только для крупных городов. Нельзя не отметить, что данное направление развивается, и результаты постепенно становятся лучше. Для запуска поиска по картам достаточно добавить слово «карта» к своему поисковому запросу.
Обладатели аккаунтов Google при настройке поиска могут включить режим записи своих поисковых запросов. Полученные сведения о переходах по ссылкам используются для улучшения списка выдачи Google. При желании историю своего поиска можно очистить в любой момент.
Google может похвастаться хорошим выбором вспомогательных справочных инструментов. Набор в строке поиска математического выражения позволит быстро вычислить его значения. Поддерживаются основные арифметические операции. В строке поиска также работает механизм перевода значений между различными единицами измерения и конвертации валют.
Некоторое время тому назад системой Google предлагался также достаточно широкий выбор поисковых операторов, которые можно было указывать в строке поиска для уточнения запроса. Сейчас большинство таких операторов доступно в форме расширенного поиска в виде фильтров. Активными и официально поддерживаемыми остались только оператор обязательного включения слова (+) и оператор автоматической подстановки слов в запрос. В последнем случае поисковик анализирует подобные по смыслу запросы, поступавшие в систему, и постарается дополнить поступивший запрос. Оператор define: позволит найти определения заданного в строке поиска слова в крупных справочных ресурсах. В то же время многие доступные ранее операторы продолжают работать. Их перечень, характеристика и примеры использования приведены в приложении А.
Активным пользователям Google стоит обратить внимание на проект Google Experimental Search, являющийся одним из разделов Google Labs (www.google.com/experimental/). Этот проект предлагает протестировать новейшие разработки Google в области поиска. Одновременно можно принять участие только в одном из предлагаемых экспериментов. В настоящее время там представлены два проекта, касающиеся работы с Google с помощью клавиатурных комбинаций.
Среди дополнительных программ для работы с Google отметим поисковые плагины для браузеров, а также официальную панель инструментов Google. Она предлагает быстрый доступ к поиску в вертикальных базах Google и возможность работы с историей поиска своего аккаунта Google. Кроме того, предлагается быстрый доступ к другим веб-сервисам Google.
Яндекс
Bing
Exalead
Соответствующие алгоритмы пытаются определить, что важней для темы поиска: обычная веб-страница, видеоролик, новость или сообщение в блоге, что и определяет порядок следования результатов в форме выдачи.
Для каждого результата приводится заголовок найденной страницы, текстовая выдержка, адрес веб-страницы, а также ссылки на сохраненную при индексировании в кэше поисковика копию веб-страницы и тематически подобные странички. Необходимо отметить, что поиск подобных веб-страниц пока не является сильной стороной Google и здесь, как правило, можно наблюдать небольшое количество результатов, а также информационный шум.
Для изображений, включенных в «универсальный» список выдачи, приводятся только их графические миниатюры. Видеоролики сопровождаются информацией об их длительности, а также дате добавления в базу.
В нижней части страницы находится поле для поиска в найденном. Его роль – возможность уточнения запроса пользователем за счет добавления новых ключевых слов (рис. 1.2).
Рис. 1.2. Инструменты уточнения запроса Google собраны на боковой панели списка выдачи
Дополнительные инструменты уточнения запроса вынесены на боковую панель, которая содержит несколько блоков фильтров. Первый сверху блок позволяет быстро перейти к поиску в основных вертикальных базах Google. Второй блок во многом повторяет перечни фильтров формы расширенного поиска. С помощью его инструментов можно отобрать результаты, представленные на языке, установленном в браузере пользователя по умолчанию, отфильтровать ссылки по дате добавления в индекс. Если пользователь является обладателем аккаунта Google, система может разделить в списке выдачи просмотренные и еще не просмотренные им результаты.
Отдельно отметим возможность настройки внешнего вида страницы выдачи Режим Колесо обозрения делит область просмотра результатов на две части. Первая предлагает визуальную карту результатов поиска: в центре демонстрируется поступивший запрос, а вокруг располагаются дополнительные, автоматически найденные ключевые слова, способные содержательно уточнить запрос. Режим Хронология упорядочивает результаты по хронологическому признаку, при этом учитывается не дата добавления страницы в индекс, а даты событий, о которых идет речь в тексте найденных веб-страниц. Данный режим позволяет наглядно увидеть историю развития той или иной темы. Для этого служит выводимая над результатами поиска «линия времени», разделенная на отрезки по 5 лет. Щелкнув на определенном делении, можно открыть результаты, текст которых относится только к этому отрезку времени.
Дополнительные варианты настройки есть и у стандартного режима просмотра. В режиме. Сайты с картинками под заголовком каждого результата поиска демонстрируются изображения, найденные на этом же сайте. В режиме. Предпросмотр страниц рядом с каждой позицией поиска выводится миниатюрный скриншот веб-страницы, что позволяет вспомнить нужный сайт по его внешнему виду.
Последней на сегодняшний день новинкой Google в области пользовательских интерфейсов стал режим «Живой поиск». Он включается автоматически при достаточной скорости интернет-соединения. В этом режиме список результатов поиска загружается немедленно после ввода или изменения поискового запроса пользователем. Кроме того, рядом со ссылками появились кнопки с изображением лупы. Они открывают всплывающие панели со скриншотами выбранных страниц.
Более подробного рассказа заслуживает режим. Поиск с переводом, который работает с помощью сервиса Google Переводчик. При его активации на странице поиска появляется меню выбора языковых пар. Результаты поиска выводятся в двух колонках: на оригинальном языке и переведенные на указанный пользователем язык. Данная функция очень полезна при поиске по национальным сегментам интернета. После перехода по переведенным ссылкам переводятся и целевые веб-страницы. Система перевода Google отличается хорошей скоростью работы, поэтому серфинг в таком режиме проблем не вызывает.
Главный плюс переводческой службы Google – большое количество поддерживаемых языков. Качество перевода с основных европейских языков вполне сносное, правда, это относится только к текстам так называемой «общей» лексики. Как только происходит переход на тематические ресурсы, качество перевода заметно падает. Как бы то ни было, в большинстве случаев понять смысл текста можно (рис. 1.3).
Рис. 1.3. Режим поиска с переводом полезен при работе с национальными сегментами интернета
Система поиска новостей в Google работает с новостными сайтами и другими ресурсами, предлагающими соответствующий контент. В отличие от веб-поиска допускается сортировка результатов не только по релевантности, но и по дате публикации.
Для поиска в блогах Google не предлагает каких-либо необычных инструментов или возможностей, просто ограничивая поиск ресурсами популярных блог-платформ. А вот база «Микроблоги» интересна тем, что индексирует сообщения популярного сервиса Twitter. Сортировка результатов поиска идет по дате их публикации. Для удобства работы со списком выдачи предлагается визуальная «линия времени», демонстрирующая количество «твитов» за последний день и позволяющая быстро находить сообщения за определенный промежуток времени.
Локальный поиск Google тесно связан с картографическими сервисами, поэтому его эффективность напрямую связана с качеством покрытия картами Google той или иной территории. Наилучшее качество обеспечивается для Северной Америки. При локальном поиске в русских ресурсах достойный охват обеспечивается только для крупных городов. Нельзя не отметить, что данное направление развивается, и результаты постепенно становятся лучше. Для запуска поиска по картам достаточно добавить слово «карта» к своему поисковому запросу.
Обладатели аккаунтов Google при настройке поиска могут включить режим записи своих поисковых запросов. Полученные сведения о переходах по ссылкам используются для улучшения списка выдачи Google. При желании историю своего поиска можно очистить в любой момент.
Google может похвастаться хорошим выбором вспомогательных справочных инструментов. Набор в строке поиска математического выражения позволит быстро вычислить его значения. Поддерживаются основные арифметические операции. В строке поиска также работает механизм перевода значений между различными единицами измерения и конвертации валют.
Некоторое время тому назад системой Google предлагался также достаточно широкий выбор поисковых операторов, которые можно было указывать в строке поиска для уточнения запроса. Сейчас большинство таких операторов доступно в форме расширенного поиска в виде фильтров. Активными и официально поддерживаемыми остались только оператор обязательного включения слова (+) и оператор автоматической подстановки слов в запрос. В последнем случае поисковик анализирует подобные по смыслу запросы, поступавшие в систему, и постарается дополнить поступивший запрос. Оператор define: позволит найти определения заданного в строке поиска слова в крупных справочных ресурсах. В то же время многие доступные ранее операторы продолжают работать. Их перечень, характеристика и примеры использования приведены в приложении А.
Активным пользователям Google стоит обратить внимание на проект Google Experimental Search, являющийся одним из разделов Google Labs (www.google.com/experimental/). Этот проект предлагает протестировать новейшие разработки Google в области поиска. Одновременно можно принять участие только в одном из предлагаемых экспериментов. В настоящее время там представлены два проекта, касающиеся работы с Google с помощью клавиатурных комбинаций.
Среди дополнительных программ для работы с Google отметим поисковые плагины для браузеров, а также официальную панель инструментов Google. Она предлагает быстрый доступ к поиску в вертикальных базах Google и возможность работы с историей поиска своего аккаунта Google. Кроме того, предлагается быстрый доступ к другим веб-сервисам Google.
Яндекс
Официально представленный широкой публике в 1997 году поисковик Яндекс успешно развивался и через десять лет впервые попал в число десяти крупнейших поисковых машин мира. В русском сегменте интернета он добился лидирующих позиций, которые пока не собирается уступать, несмотря на возрастающую конкуренцию. Отличительными чертами Яндекса с начала его существования стали собственные оригинальные алгоритмы определения релевантности результатов поиска, гибкие инструменты работы с текстом запросов и учет особенностей морфологии русского языка при их обработке.
Яндекс опирается на собственные индексные базы. Кроме поиска по веб-документам система предлагает неплохой выбор специализированных ресурсов и дополнительных сервисов. Яндекс в настоящее время работает с изображениями, видео, новостями, блогами и словарями. Мощные поисковые возможности заложены также в собственном картографическом сервисе и в системе поиска товаров. Кроме того, Яндекс ведет собственный каталог веб-сайтов. Сильной стороной Яндекса является развитая программа локального поиска, что особенно актуально для наших пользователей. Яндекс предоставляет возможность доступа к своим базам сторонним разработчикам. Как следствие, немало русских проектов альтернативного интернет-поиска так или иначе используют ресурсы Яндекса. Кроме обычной системы поиска предлагается и сокращенный вариант Яндекса, доступный по адресу ya.ru. Интерфейс этой версии состоит только из поля ввода запроса и кнопки начала поиска.
Поиск в веб-документах предлагает режимы простого и расширенного поиска. Простой поиск не предоставляет каких-либо фильтров, что компенсируется возможностью автоматического разбора запросов на естественном языке, уверенной обработкой относительно длинных запросов, а также системой автоматического дополнения запроса. Максимальная длина запроса – сорок слов.
Форма расширенного поиска для составления запроса предлагает только одно поле. Логические операторы, связывающие слова запроса, предлагается вводить вручную, благо. Яндекс располагает достаточно подробным языком запросов. Остальные инструменты формы расширенного поиска – это различные фильтры (1.4).
Рис. 1.4. Форма расширенного поиска системы Яндекс
Поле На сайте позволяет ограничить поиск определенным сайтом. Поле В регионе является фильтром, с помощью которого можно перейти к локальному поиску в ресурсах, связанных с определенной географической областью.
Фильтр Слова позволяет гибко управлять областью поиска указанных ключевых слов. Поиск может вестись как во всем тексте веб-страниц, так и ограничиваться только их заголовками. Здесь же находится группа переключателей, отвечающая за работу механизма учета морфологии в ходе поиска. Переключатель В любой форме дает поисковику команду искать не только указанную в запросе форму слова, но и другие его варианты. Переключатель Точно так, как в запросе отключает эту функцию Яндекса для всех слов запроса. Фильтр Язык ограничивает область поиска только документами на определенном языке. Поддерживается восемь языков, в том числе украинский, белорусский, татарский и казахский – достаточно редкие гости на других поисковых системах.
Фильтр Дата обновления позволяет указать временной промежуток создания или обновления нужных веб-страниц. Помимо перечня интервалов, данный фильтр позволяет указать произвольный диапазон дат. Фильтр Формат отвечает за выбор форматов нужных документов. Кроме веб-страниц в формате HTML, Яндекс индексирует файлы Microsoft Office (DOC, XLS, PPT), RTF, PDF и Flash-ролики. Интересно, что при ранжировании результатов поиска файлов различных типов используются стандартные алгоритмы Яндекса для работы с текстом и особенностями оформления. Для проиндексированных файлов названных типов в кэше поисковика сохраняется их текстовая версия.
Под формой составления запроса выводится блок, в котором составленный с помощью перечисленных инструментов запрос формулируется в виде текста на естественном языке. Это позволяет лучше представить условия запроса и избежать логических несоответствий.
Страница выдачи результатов поиска содержит список найденных ссылок. По умолчанию он сортируется по релевантности. Поддерживается также сортировка результатов по дате публикации или обновления. Переключатель режимов сортировки находится в нижней части страницы.
Для каждого результата приводится заголовок страницы, текстовая выдержка, ссылки на сохраненную копию страницы и другие результаты этого запроса к данному сайту. Для крупных интернет-ресурсов демонстрируются также ссылки на их основные разделы Наблюдать работу этого механизма можно, например, в результатах, полученных на крупных справочных ресурсах.
Непосредственно возле поля запроса находятся переключатели режимов поиска в найденном и локального поиска. Регион для локального поиска определяется автоматически, на основе IP-адреса пользователя. Изменить его можно вручную при общей настройке механизма поиска Яндекса.
Боковая панель страницы выдачи предлагает ссылки на результаты поиска по введенному пользователем запросу в вертикальных базах изображений и видео. Каких-либо дополнительных инструментов быстрого уточнения запроса на странице выдачи Яндекса нет (рис. 1.5).
Рис. 1.5. Страница выдачи поисковой системы Яндекс
После регистрации бесплатного аккаунта открывается доступ к службе «Мои находки». Она предназначена для сохранения истории поиска с помощью Яндекса. Любопытно, что сохраненные запросы впоследствии демонстрируются в списке автоподсказок при наборе нового запроса в поле поиска.
Новостной поиск Яндекса основан на индексировании ресурсов, участвующих в партнерской программе поисковика. Для попадания в индекс ресурс должен удовлетворять ряду требований как технического плана, так и организационного. В частности, сайт должен предлагать оригинальный контент, регулярно обновляться, а также иметь определенный стаж работы в интернете.
При поиске новостей на первый план выходит оперативность обновления индексных баз. Для решения этой задачи используется особый робот-индексатор, способный обрабатывать ресурсы в течение короткого промежутка времени. В результатах поиска можно увидеть ресурсы, обновленные десяток минут назад. Правда, такая оперативность достигается не для всех ресурсов, и в среднем Яндекс индексирует новости немного медленней, чем Google.
Форма расширенного поиска в новостях значительно отличается от аналогичной формы обычного веб-поиска. С ее помощью можно выбрать одну или несколько новостных рубрик для поиска и определиться с регионом, к которому должны относиться новостные сообщения. Фильтр Источники содержит перечень новостных ресурсов, с которыми работает Яндекс. При необходимости в этом списке можно отобрать только нужные источники и ограничить ими поиск.
Страница результатов поиска в новостях также имеет свои отличия. Фильтр Результаты поиска не только выводит статистику проведенного поиска, но и позволяет одним щелчком отобрать видеосообщения, статьи или интервью. Здесь же выводятся ссылки на так называемые пресс-портреты героев новостей, найденных по запросу пользователя. Пресс-портрет содержит краткую характеристику персонажа, его основной деятельности, список доступных интервью, перечень последних новостей, а также список пресс-портретов людей, часто упоминающихся в новостях вместе с данной личностью. Необходимо отметить, что пресс-портрет – это не заранее составленная справочная статья, а результат автоматической обработки информации новостных ресурсов.
Фильтр времени публикации позволяет отбирать новости по запросу за определенный промежуток времени – от текущего дня до месяца. А вот расположенная непосредственно под полем запроса панель с перечнем основных новостных рубрик поисковым фильтром не является – это просто ссылки на тематические страницы с последними новостями.
Результаты поиска по умолчанию группируются по сюжетам – подборкам новостей, посвященных одному событию, что позволяет составить мнение о том или ином событии по материалам нескольких источников. Для каждого результата приводятся заголовок, источник и время публикации.
Сервис Яндекс. Словари является справочным ресурсом. Он предлагает поиск по крупным онлайновым словарям и энциклопедиям, а также перевод на иностранные языки. Для уточнения запроса служит фильтр типа справочного ресурса. Поиск может быть ограничен только энциклопедиями или только результатами перевода. На странице выдачи результаты группируются по видам словарей, в которых было найдено определение ключевого слова из запроса. Сначала выводятся результаты универсальных источников, затем – тематических словарей и справочников. Результаты перевода на другие языки демонстрируются на отдельной панели.
Сервис Яндекс. Блоги работает с крупными блог-площадками, а также форумами, экспортирующими информацию о своих сообщениях в формате RSS. Доступны простой и расширенный режимы поиска. Простой поиск не предлагает каких-либо дополнительных инструментов, кроме самой строки поиска. Режим расширенного поиска здесь обладает своей спецификой, отражающей особенности контента. Фильтр Область поиска позволяет выбирать для поиска конкретный вид социального ресурса: блог, микроблог или форум. Поддерживается поиск в конкретном ресурсе и в диапазоне указанных пользователем дат. Особенно интересен блок фильтров. Автор. Он позволяет искать сообщения конкретного автора или сообщества. Кроме того, предлагается фильтр персональных характеристик автора: возраст, местоположение, пол и даже музыка, прослушиваемая автором в момент публикации записи, если, конечно же, в блоге есть такая информация. При поиске в блогах поддерживаются все стандартные поисковые операторы Яндекса, а также некоторое количество специальных операторов, которые в большинстве своем воспроизводят функции фильтров расширенного поиска.
Яндекс отличается гибким и достаточно подробным языком поисковых операторов, который можно использовать при составлении запроса. Подробный перечень доступных операторов, а также примеры их использования приведены в приложении А.
Из дополнительных поисковых инструментов отметим панель для браузеров Яндекс.Бар. Она предлагает быстрый поиск на всех сервисах Яндекса, умеет подсвечивать найденные слова на веб-страницах, а также переводить выделенные пользователем слова на иностранные языки.
Яндекс опирается на собственные индексные базы. Кроме поиска по веб-документам система предлагает неплохой выбор специализированных ресурсов и дополнительных сервисов. Яндекс в настоящее время работает с изображениями, видео, новостями, блогами и словарями. Мощные поисковые возможности заложены также в собственном картографическом сервисе и в системе поиска товаров. Кроме того, Яндекс ведет собственный каталог веб-сайтов. Сильной стороной Яндекса является развитая программа локального поиска, что особенно актуально для наших пользователей. Яндекс предоставляет возможность доступа к своим базам сторонним разработчикам. Как следствие, немало русских проектов альтернативного интернет-поиска так или иначе используют ресурсы Яндекса. Кроме обычной системы поиска предлагается и сокращенный вариант Яндекса, доступный по адресу ya.ru. Интерфейс этой версии состоит только из поля ввода запроса и кнопки начала поиска.
Поиск в веб-документах предлагает режимы простого и расширенного поиска. Простой поиск не предоставляет каких-либо фильтров, что компенсируется возможностью автоматического разбора запросов на естественном языке, уверенной обработкой относительно длинных запросов, а также системой автоматического дополнения запроса. Максимальная длина запроса – сорок слов.
Форма расширенного поиска для составления запроса предлагает только одно поле. Логические операторы, связывающие слова запроса, предлагается вводить вручную, благо. Яндекс располагает достаточно подробным языком запросов. Остальные инструменты формы расширенного поиска – это различные фильтры (1.4).
Рис. 1.4. Форма расширенного поиска системы Яндекс
Поле На сайте позволяет ограничить поиск определенным сайтом. Поле В регионе является фильтром, с помощью которого можно перейти к локальному поиску в ресурсах, связанных с определенной географической областью.
Фильтр Слова позволяет гибко управлять областью поиска указанных ключевых слов. Поиск может вестись как во всем тексте веб-страниц, так и ограничиваться только их заголовками. Здесь же находится группа переключателей, отвечающая за работу механизма учета морфологии в ходе поиска. Переключатель В любой форме дает поисковику команду искать не только указанную в запросе форму слова, но и другие его варианты. Переключатель Точно так, как в запросе отключает эту функцию Яндекса для всех слов запроса. Фильтр Язык ограничивает область поиска только документами на определенном языке. Поддерживается восемь языков, в том числе украинский, белорусский, татарский и казахский – достаточно редкие гости на других поисковых системах.
Фильтр Дата обновления позволяет указать временной промежуток создания или обновления нужных веб-страниц. Помимо перечня интервалов, данный фильтр позволяет указать произвольный диапазон дат. Фильтр Формат отвечает за выбор форматов нужных документов. Кроме веб-страниц в формате HTML, Яндекс индексирует файлы Microsoft Office (DOC, XLS, PPT), RTF, PDF и Flash-ролики. Интересно, что при ранжировании результатов поиска файлов различных типов используются стандартные алгоритмы Яндекса для работы с текстом и особенностями оформления. Для проиндексированных файлов названных типов в кэше поисковика сохраняется их текстовая версия.
Под формой составления запроса выводится блок, в котором составленный с помощью перечисленных инструментов запрос формулируется в виде текста на естественном языке. Это позволяет лучше представить условия запроса и избежать логических несоответствий.
Страница выдачи результатов поиска содержит список найденных ссылок. По умолчанию он сортируется по релевантности. Поддерживается также сортировка результатов по дате публикации или обновления. Переключатель режимов сортировки находится в нижней части страницы.
Для каждого результата приводится заголовок страницы, текстовая выдержка, ссылки на сохраненную копию страницы и другие результаты этого запроса к данному сайту. Для крупных интернет-ресурсов демонстрируются также ссылки на их основные разделы Наблюдать работу этого механизма можно, например, в результатах, полученных на крупных справочных ресурсах.
Непосредственно возле поля запроса находятся переключатели режимов поиска в найденном и локального поиска. Регион для локального поиска определяется автоматически, на основе IP-адреса пользователя. Изменить его можно вручную при общей настройке механизма поиска Яндекса.
Боковая панель страницы выдачи предлагает ссылки на результаты поиска по введенному пользователем запросу в вертикальных базах изображений и видео. Каких-либо дополнительных инструментов быстрого уточнения запроса на странице выдачи Яндекса нет (рис. 1.5).
Рис. 1.5. Страница выдачи поисковой системы Яндекс
После регистрации бесплатного аккаунта открывается доступ к службе «Мои находки». Она предназначена для сохранения истории поиска с помощью Яндекса. Любопытно, что сохраненные запросы впоследствии демонстрируются в списке автоподсказок при наборе нового запроса в поле поиска.
Новостной поиск Яндекса основан на индексировании ресурсов, участвующих в партнерской программе поисковика. Для попадания в индекс ресурс должен удовлетворять ряду требований как технического плана, так и организационного. В частности, сайт должен предлагать оригинальный контент, регулярно обновляться, а также иметь определенный стаж работы в интернете.
При поиске новостей на первый план выходит оперативность обновления индексных баз. Для решения этой задачи используется особый робот-индексатор, способный обрабатывать ресурсы в течение короткого промежутка времени. В результатах поиска можно увидеть ресурсы, обновленные десяток минут назад. Правда, такая оперативность достигается не для всех ресурсов, и в среднем Яндекс индексирует новости немного медленней, чем Google.
Форма расширенного поиска в новостях значительно отличается от аналогичной формы обычного веб-поиска. С ее помощью можно выбрать одну или несколько новостных рубрик для поиска и определиться с регионом, к которому должны относиться новостные сообщения. Фильтр Источники содержит перечень новостных ресурсов, с которыми работает Яндекс. При необходимости в этом списке можно отобрать только нужные источники и ограничить ими поиск.
Страница результатов поиска в новостях также имеет свои отличия. Фильтр Результаты поиска не только выводит статистику проведенного поиска, но и позволяет одним щелчком отобрать видеосообщения, статьи или интервью. Здесь же выводятся ссылки на так называемые пресс-портреты героев новостей, найденных по запросу пользователя. Пресс-портрет содержит краткую характеристику персонажа, его основной деятельности, список доступных интервью, перечень последних новостей, а также список пресс-портретов людей, часто упоминающихся в новостях вместе с данной личностью. Необходимо отметить, что пресс-портрет – это не заранее составленная справочная статья, а результат автоматической обработки информации новостных ресурсов.
Фильтр времени публикации позволяет отбирать новости по запросу за определенный промежуток времени – от текущего дня до месяца. А вот расположенная непосредственно под полем запроса панель с перечнем основных новостных рубрик поисковым фильтром не является – это просто ссылки на тематические страницы с последними новостями.
Результаты поиска по умолчанию группируются по сюжетам – подборкам новостей, посвященных одному событию, что позволяет составить мнение о том или ином событии по материалам нескольких источников. Для каждого результата приводятся заголовок, источник и время публикации.
Сервис Яндекс. Словари является справочным ресурсом. Он предлагает поиск по крупным онлайновым словарям и энциклопедиям, а также перевод на иностранные языки. Для уточнения запроса служит фильтр типа справочного ресурса. Поиск может быть ограничен только энциклопедиями или только результатами перевода. На странице выдачи результаты группируются по видам словарей, в которых было найдено определение ключевого слова из запроса. Сначала выводятся результаты универсальных источников, затем – тематических словарей и справочников. Результаты перевода на другие языки демонстрируются на отдельной панели.
Сервис Яндекс. Блоги работает с крупными блог-площадками, а также форумами, экспортирующими информацию о своих сообщениях в формате RSS. Доступны простой и расширенный режимы поиска. Простой поиск не предлагает каких-либо дополнительных инструментов, кроме самой строки поиска. Режим расширенного поиска здесь обладает своей спецификой, отражающей особенности контента. Фильтр Область поиска позволяет выбирать для поиска конкретный вид социального ресурса: блог, микроблог или форум. Поддерживается поиск в конкретном ресурсе и в диапазоне указанных пользователем дат. Особенно интересен блок фильтров. Автор. Он позволяет искать сообщения конкретного автора или сообщества. Кроме того, предлагается фильтр персональных характеристик автора: возраст, местоположение, пол и даже музыка, прослушиваемая автором в момент публикации записи, если, конечно же, в блоге есть такая информация. При поиске в блогах поддерживаются все стандартные поисковые операторы Яндекса, а также некоторое количество специальных операторов, которые в большинстве своем воспроизводят функции фильтров расширенного поиска.
Яндекс отличается гибким и достаточно подробным языком поисковых операторов, который можно использовать при составлении запроса. Подробный перечень доступных операторов, а также примеры их использования приведены в приложении А.
Из дополнительных поисковых инструментов отметим панель для браузеров Яндекс.Бар. Она предлагает быстрый поиск на всех сервисах Яндекса, умеет подсвечивать найденные слова на веб-страницах, а также переводить выделенные пользователем слова на иностранные языки.
Bing
Историю интернет-поиска от Microsoft простой не назовешь. На последовательно предлагаемых публике сервисах неоднократно менялись алгоритмы, используемые базы данных и, конечно же, названия. До начала 2000-х поисковик не располагал собственными базами и работал с внешними индексами от AltaVista, Inktomi и Looksmart. Первоначальное имя MSN Search использовалось до 2006 года, а затем на несколько лет изменение названий поисковика стало для Microsoft традицией.
Вместе с окончательным переходом на поиск в собственных индексныхMSN Search была переименована сначала в Windows LiveLive Search. Наконец, в начале лета 2009 на смену Live Search пришел новый поисковый проект Bing.
«Bing позволит иначе взглянуть на поиск информации в интернете и поможет пользователям в принятии важных решений», – именно таким заявлением начинался пресс-релиз Microsoft, посвященный запуску Bing. Стремления разработчиков были понятны: поисковики от Microsoft, несмотря на все старания, на Западе стабильно уступали по популярности лидерам – Google и Yahoo!. Если же говорить о русскоязычных версиях предыдущих поисковых проектов Microsoft, то по количеству и качеству находимых ссылок они намного уступали крупным российским поисковикам. В попытке догнать конкурентов разработчики Bing сделали ставку на улучшение качества поиска и внедрение новых технологий, многие из которых были приобретены вместе с создавшими их фирмами.
Необходимо заметить, что русскоязычная версия Bing, как и большинство других локализованных версий, лишена ряда дополнительных функций, например поиска по магазинам. Поскольку они, по сути, работают только в Северной. Америке, подробно останавливаться на них смысла нет.
В настоящее время Bing работает по собственным индексным базам и предлагает поиск веб-страниц, изображений и видеороликов. Все эти базы представлены в виде вкладок над главным полем поиска.
При поиске веб-документов доступны режимы простого и расширенного поиска. Интерфейс такого привычного элемента, как форма расширенного поиска, в Bing выполнен достаточно интересно. Форма открывается не в новом окне, а прямо на странице выдачи, что достаточно удобно, поскольку результаты изменения запроса на странице выдачи отражаются сразу, и уточнение запроса происходит весьма быстро.
К сожалению, система Bing лишена некоторых полезных и привычных на других крупных поисковиках функций. Например, она не обрабатывает слова, по ошибке набранные в другой раскладке, что уже давно умеют делать многие конкуренты. Не справляется она и с опечатками в ключевых словах – как на русском, так и на английском языках.
Форма расширенного поиска Bing состоит из четырех вкладок. Вкладка Условия поиска предлагает работу с логическими операторами, которые выбираются в предлагаемом выпадающем меню. Новые ключевые слова с автоматически добавленными операторами присоединяются к исходному поисковому запросу. Вкладка Веб-сайт или домен позволяет вести поиск только на конкретном сайте или домене, а также исключать соответствующие ресурсы из результатов поиска. Вкладки Страна или регион и Язык в полном соответствии со своими названиями дают возможность ограничить поиск определенным национальным сегментом интернета или же веб-страницами на указанном языке. Отметим, что в отличие от Google и Яндекс, в Bing поиск можно вести одновременно по нескольким выбранным языкам. Для этого достаточно добавить несколько соответствующих условий в форме расширенного поиска.
Страница поисковой выдачи Bing состоит из области просмотра результатов и боковой панели, содержащей вспомогательные инструменты. При веб-поиске на этой панели демонстрируются предложения по уточнению запроса. Надо сказать, что данная технология действительно работает неплохо и помогает быстро уточнять запросы. Для найденных ссылок показываются заголовок и адрес веб-страницы, краткая текстовая выдержка, а также ссылка на кэшированную версию страницы (рис. 1.6).
Рис. 1.6. Форма расширенного поиска Bing открывается прямо на странице результатов поиска
Мультимедиа-поиск Bing представлен базами изображений и видео. Для поиска изображений предлагается только режим простого поиска. Инструменты уточнения запроса вынесены на боковую панель страницы выдачи Доступны несколько фильтров. К традиционным для современных универсальных поисковиков отнесем фильтры размера картинки и ее цветности. В меню фильтра размера изображения присутствует пункт. Фоновые рисунки, который позволяет отбирать картинки в стандартных разрешениях для использования в качестве «обоев» рабочего стола персонального компьютера. Фильтр Макет позволяет отобрать изображения различных форматов: квадратные, широкоэкранные, а также высокие, то есть ориентированные по вертикали.
Гораздо интересней эффект применения фильтров, анализирующих визуальные характеристики самого изображения. Фильтр Стиль достаточно успешно отличает фотоснимки от рисунков и коллажей. Любопытен поиск по наличию на изображении людей, который предлагает несколько возможностей: можно искать только лица, портреты или же изображения людей в полный рост. Работает этот фильтр весьма качественно. Отметим, что система неплохо справляется даже с рисованными изображениями.
Дополнений у поисковика Microsoft Bing немного. Предложения ограничиваются поисковыми плагинами для браузеров.
Вместе с окончательным переходом на поиск в собственных индексныхMSN Search была переименована сначала в Windows LiveLive Search. Наконец, в начале лета 2009 на смену Live Search пришел новый поисковый проект Bing.
«Bing позволит иначе взглянуть на поиск информации в интернете и поможет пользователям в принятии важных решений», – именно таким заявлением начинался пресс-релиз Microsoft, посвященный запуску Bing. Стремления разработчиков были понятны: поисковики от Microsoft, несмотря на все старания, на Западе стабильно уступали по популярности лидерам – Google и Yahoo!. Если же говорить о русскоязычных версиях предыдущих поисковых проектов Microsoft, то по количеству и качеству находимых ссылок они намного уступали крупным российским поисковикам. В попытке догнать конкурентов разработчики Bing сделали ставку на улучшение качества поиска и внедрение новых технологий, многие из которых были приобретены вместе с создавшими их фирмами.
Необходимо заметить, что русскоязычная версия Bing, как и большинство других локализованных версий, лишена ряда дополнительных функций, например поиска по магазинам. Поскольку они, по сути, работают только в Северной. Америке, подробно останавливаться на них смысла нет.
В настоящее время Bing работает по собственным индексным базам и предлагает поиск веб-страниц, изображений и видеороликов. Все эти базы представлены в виде вкладок над главным полем поиска.
При поиске веб-документов доступны режимы простого и расширенного поиска. Интерфейс такого привычного элемента, как форма расширенного поиска, в Bing выполнен достаточно интересно. Форма открывается не в новом окне, а прямо на странице выдачи, что достаточно удобно, поскольку результаты изменения запроса на странице выдачи отражаются сразу, и уточнение запроса происходит весьма быстро.
К сожалению, система Bing лишена некоторых полезных и привычных на других крупных поисковиках функций. Например, она не обрабатывает слова, по ошибке набранные в другой раскладке, что уже давно умеют делать многие конкуренты. Не справляется она и с опечатками в ключевых словах – как на русском, так и на английском языках.
Форма расширенного поиска Bing состоит из четырех вкладок. Вкладка Условия поиска предлагает работу с логическими операторами, которые выбираются в предлагаемом выпадающем меню. Новые ключевые слова с автоматически добавленными операторами присоединяются к исходному поисковому запросу. Вкладка Веб-сайт или домен позволяет вести поиск только на конкретном сайте или домене, а также исключать соответствующие ресурсы из результатов поиска. Вкладки Страна или регион и Язык в полном соответствии со своими названиями дают возможность ограничить поиск определенным национальным сегментом интернета или же веб-страницами на указанном языке. Отметим, что в отличие от Google и Яндекс, в Bing поиск можно вести одновременно по нескольким выбранным языкам. Для этого достаточно добавить несколько соответствующих условий в форме расширенного поиска.
Страница поисковой выдачи Bing состоит из области просмотра результатов и боковой панели, содержащей вспомогательные инструменты. При веб-поиске на этой панели демонстрируются предложения по уточнению запроса. Надо сказать, что данная технология действительно работает неплохо и помогает быстро уточнять запросы. Для найденных ссылок показываются заголовок и адрес веб-страницы, краткая текстовая выдержка, а также ссылка на кэшированную версию страницы (рис. 1.6).
Рис. 1.6. Форма расширенного поиска Bing открывается прямо на странице результатов поиска
Мультимедиа-поиск Bing представлен базами изображений и видео. Для поиска изображений предлагается только режим простого поиска. Инструменты уточнения запроса вынесены на боковую панель страницы выдачи Доступны несколько фильтров. К традиционным для современных универсальных поисковиков отнесем фильтры размера картинки и ее цветности. В меню фильтра размера изображения присутствует пункт. Фоновые рисунки, который позволяет отбирать картинки в стандартных разрешениях для использования в качестве «обоев» рабочего стола персонального компьютера. Фильтр Макет позволяет отобрать изображения различных форматов: квадратные, широкоэкранные, а также высокие, то есть ориентированные по вертикали.
Гораздо интересней эффект применения фильтров, анализирующих визуальные характеристики самого изображения. Фильтр Стиль достаточно успешно отличает фотоснимки от рисунков и коллажей. Любопытен поиск по наличию на изображении людей, который предлагает несколько возможностей: можно искать только лица, портреты или же изображения людей в полный рост. Работает этот фильтр весьма качественно. Отметим, что система неплохо справляется даже с рисованными изображениями.
Дополнений у поисковика Microsoft Bing немного. Предложения ограничиваются поисковыми плагинами для браузеров.
Exalead
Одной из особенностей Европы, в том числе и в сфере интернет-поиска, является большое количество национальных языков. Поисковик, претендующий на место ведущего в Европе, просто обязан хорошо индексировать национальные сегменты интернета и качественно обрабатывать запросы на многочисленных европейских языках – как крупнейших, так и менее распространенных. Именно в данной области европейская разработка может получить серьезное конкурентное преимущество по сравнению с мощными заокеанскими конкурентами. На роль такого европейского поисковика в настоящее время всерьез претендует система Exalead. Данный проект был разработан в рамках исследовательской программы Quaere, финансируемой Евросоюзом.