Яндекс начал искать по зарубежному интернету
Российские пользователи интернета не ограничиваются русскоязычными ресурсами
— им интересны страницы и сайты на разных языках. Примерно 15 процентов запросов
к Яндексу не содержат кириллицу.
Яндекс давно индексирует иностранные документы, размещенные в так называемой
русскоязычной зоне интернета (домены государств СНГ и крупные сайты со всего
мира, полезные русскоязычным пользователям). Теперь мы существенно расширили
базу за счет зарубежного интернета. Пока в выдачу по запросу попадает не более
одного иностранного документа из этой зоны. Ранжирование происходит в
соответствии с общими правилами, то есть, такой документ окажется на первом
месте, только если он наиболее соответствует запросу.
Размер базы зарубежного интернета — примерно 1 млрд веб-страниц, и эта цифра
будет расти.
Примеры:
* flickr — http://www.yandex.ru/yandsearch?text=flickr
* BBDO — http://www.yandex.ru/yandsearch?text=BBDO
* Nick Hornby About a Boy —
http://www.yandex.ru/yandsearch?text=Nick+Hornby+About+a+Boy
* Southland Tales — http://www.yandex.ru/yandsearch?text=Southland+Tales
Подмешивание документов из зарубежного интернета в основную выдачу сейчас носит
экспериментальный характер. После сбора статистики и пользовательских отзывов
ранжирование для таких документов будет значительно улучшено.