Яндекс запустил новую поисковую платформу — Калининград

Специально или случайно, но скорее первое, чем второе, 12.12.2012 года Яндекс запустил новый поисковый алгоритм под условным именем «Калининград». Некоторые специалисты стали иронизировать на тему даты появления алгоритма, якобы это намек такой всей области SEO.

Новый алгоритм был представлен на пресс-конференции Яндекса, которую открыл доклад директора по распространению технологий Георгия Бакунова. Вначале доклада Георгий немного погрузился в историю развития поисковых технологий. После этого перешел непосредственно к теме представления нового алгоритма.

Небольшой экскурс в историю был совсем не случаен, поскольку на контрасте того, с чего все начиналось, можно было понять насколько далеко ушли вперед современные поисковые алгоритмы. Значительное увеличение объема информации в сети, новых пользователей и их уникальных потребностей в конкретном результате. До этого релевантность конкретного документа определялась только соответствием его содержания заданному ключевому слову. Поначалу показатель релевантности для всех пользователей был одинаков.

По мере развития Интернет и роста объемов предоставляемой информации, алгоритмы оценки релевантности документов усложнялись с целью повышения качества поиска. Метод оценки релевантности документов в определенный момент исчерпал себя. Появилось понимание необходимости сегментировать пользователей поисковых систем по каким-то параметрам. Яндекс, как и большинство поисковых систем, условно разделили пользователей на регионы. К настоящему моменту Яндекс делит всех пользователей более чем на 1200 регионов. Для каждого поискового региона введена своя формула определения релевантности.

Ближе к концу 2011 года в Яндексе пришли к выводу, что метод определения релевантности по региону слишком примитивен. Согласитесь, вписывая в поисковую строку слово «пицца», человек находящийся в Москве, может искать не только как заказать пиццу, но и рецепт приготовления пиццы. Именно так специалисты Яндекса пришли к выводу, что поисковый алгоритм должен быть для каждого пользователя свой. Именно эта ключевая особенность и отличает новый поисковый алгоритм «Калининград» от его предшественников.

В алгоритм «Калининград» включена формула определения релевантности страниц уникальная для каждого отдельного пользователя.

Продолжил рассказ о новом поисковом алгоритме Яндекса менеджер поисковых проектов Денис Рогачевский.

Денис рассказал, что в процессе анализа поисковых запросов пользователей специалистами Яндекса был сделан вывод о соотношении поиска уже знакомой и новой информации. Примерно в 30% случаев пользователи искали не новую информацию, а  уже знакомую. Ту информацию, к которой уже привыкли. Фактически, персонализация поиска — это своего рода быстрый доступ к уже знакомым любимым ресурсам.

«Любимые сайты» обладают важной отличительной особенностью: если человек их видит в результатах поисковой выдачи, он по ним если и не обязательно кликнет, то сделает это с высокой долей вероятности. С вводом нового алгоритма определения релевантности страниц, Яндекс будет показывать «любимые сайты» чаще и значительно выше в выдаче результатов.

Персонализация алгоритма определения релевантности берет во внимание те цепочки запросов, которые человек уже задавал и какими ресурсами интересовался. В данной ситуации, зная общие интересы пользователя на основании его более ранних запросов, и сопоставляя с базой данных поисковой системы, мы можем даже по короткому запросу определить, что в конечном итоге ищет пользователь. При этом, пользователю совсем не обязательно теперь проходить весь путь отбора конечного результата с целью получить желаемый результат поиска.

Текущая версия поискового алгоритма — результат года экспериментов и проб. За этот год Яндексом было опробовано 10 различных формул определения интересов пользователей. В эксперименте участвовало более 50 миллионов пользователей.

Отличии персонализированных поисковых подсказок от неперсонализированных очевидны: последние покажут только самые популярные запросы. Персонализированные — напротив, покажут только то, что нужно вам и соответствует вашим интересам.

Специалистами Яндекса пользователи были разделены на группы людей, которые ищут схожую по тематике информацию. Всего получилось более 400 тысяч групп запросов. Опираясь на это условное деление, Яндекс формирует персонализированные списки поисковых подсказок для конкретных пользователей.

Все запросы имеют важное свойство, которое их объединяет — это тема запросов. В итоге анализа тем и групп запросов, определяется персональное ранжирование. Каждый запрос имеет по меньшей мере десяток разных результатов поиска. Каждый такой результат по-своему уникален.

Фактически Яндекс реализовал механизм определения индивидуальных результатов поиска без использования сегментирования на регионы и по другим признакам. Теперь поисковая машина не делит результаты поиска на группы. Используется алгоритм с бесконечной поисковой формулой индивидуальной для каждого пользователя.

Рассмотрим пример. В качестве примера возьмем поисковый запрос «аватарки». Пользователи одного региона получают одинаковую поисковую выдачу и кликают на одних и тех же результатах. Но есть категория пользователей из данного региона, которые кликают только на четвертый результат. Возникает закономерный вопрос: «Почему так происходит?»

Причину такого поведения понять невозможно без проведения анализа предыдущих запросов этой категории пользователей. Люди, интересующиеся социальной сетью ВКонтакте всегда будут кликать на результаты связанные с этим ресурсом. По этой причине важно брать во внимание интересы пользователя, и в первых строках поисковой выдачи показывать аватарки для этой социальной сети. Такой способ ранжирования существенно экономит время пользователя на поиск нужного ему результата.

После ввода алгоритма «Калининград» Яндекс понимает не просто много разных тем и групп запросов, но и кому и как эти результаты показывать. Поэтому у активных пользователей Интернет со включенной функцией персонализированного поиска до 75% результатов поисковой выдачи может быть уникально.

При персонализации результатов поисковой выдачи до 37% увеличивается вероятность клика на первой позиции против результатов обычной поисковой выдачи без персонализации.

Яндекс сохранил возможность отключения функции персонального поиска, но по статистике эта функция позволяет экономить до 14% времени на поиск нужного результата. Более существенно это оказывается для условно среднего пользователя, который задает около 50 запросов в неделю. Если посчитать дополнительные затраты времени для такого количества запросов, то экономия окажется существенной.

Новый поисковый алгоритм позволяет получить быстрый доступ к любимым сайтам, дает поисковые подсказки, которые наилучшим образом учитывают интересы отдельного пользователя. Подсказки адаптируются к вашим интересам и ранее сделанным запросам. В итоге качество поисковой выдачи для отдельного пользователя вырастает значительно, а сам пользователь существенно экономит свое время для получения качественного поискового результата.