Новый алгоритм от Яндекса – Палех
Ежедневно поисковой системе Яндекс приходится отвечать примерно на 280 миллионов запросов. Некоторые из них, например, [вконтакте], пользуются максимально высоким спросом – в поисковую строку люди вводят такие запросы чуть ли не каждую секунду. Встречаются и уникальные запросы – человек задал их единожды и, возможно, такой запрос больше никогда не повторится. Редких запросов достаточно много – порядка ста миллионов в день.
Все запросы Яндекса, если составить график их частотного распределения, можно представить в виде птицы, у которой присутствует клюв, туловище и длинный хвост. Самые распространенные запросы количественно невелики, но их вводят в поиск очень часто – их можно отнести к «клюву» птички. Далее идут запросы со средней частотностью, которые относят к «туловищу». Сами по себе низкочастотные запросы, если их брать по отдельности, люди вводят крайне редко, однако они являются существенной частью поискового потока. Их размещают в «длинный хвост».
Разработанный алгоритм дает возможность поиску Яндекса качественнее реагировать на сложные запросы, находящиеся в «длинном хвосте».
Алгоритм получил название «Палех» за счет своего хвоста. Такой хвост присутствует у сказочной Жар-птицы, появляющейся на палехской миниатюре.
Оригинал новости: Блог вебмастеров.