пятница, июля 16

Amit Singhal о мечтах поисковой системы Google.


Для того, чтобы хоть немного понять, что делает Google самым популярным и эффективным поисковиком, Engadget.com задал несколько вопросов главному инженеру этой компании. Amit Singhal является частью производственной команды, отвечает за настройки и повышение рейтинга Google, «алгоритмы и 20ти летний опыт».

Двумя основными задачами информационного поиска, говорит Amit, являются объемы и задержки. Т.е. насколько данные доступны и сколько времени потребуется для их индексации. Цель Google заключается в сборе информации по всему миру, не только там, где информация доступно оформлена для восприятия (другими словами в веб сети), но и создание карт (Google Maps), книг (Google Books) и прочих удобных гаджетов.

Поиск по тексту. Google способна находить слова за пределами кода – во вложенных файлах, комментариях, примечаниях, подписях картинок, которые согласуются с запросом пользователя. Также системой учитываются оптические данные: цвета, формы и другие параметры, отвечающие требованиям запроса.

Поиск по языкам. Это очевидно, но не весь мир говорит или разговаривает на английском языке. Сейчас Google способен сортировать результаты по языкам и переводить их с помощью Google Translate, в случае, если на родном языке не найдено нужных результатов.

Поиск в настоящее время. Поиск в режиме реального времени Google представила в декабре прошлого года. Это в основном терабайты информации таких социальных сетей как Twitter, Facebook, MySpace и RSS каналы, новостные сайты. Решением данной задачи является сокращение времени между написанием статьи и возможностью доступа к ней. К примеру одно американское новостное агентство обновляется каждые 12 минут. В этой системе существует множество трудно решаемых проблем и работает такая фишка не стабильно. «Но поэтому ни один поисковик не решается это реализовать – потому что это безумно трудно!».

Комментариев нет:

Отправить комментарий