Главное Свежее Вакансии Образование
Выбор редакции:
431 3 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Яндекс Палех VS Google RankBrain

Яндекс и Гугл умеют распознавать смысл текста с помощью соответствующих алгоритмов Палех и RankBrain. Изучаем, насколько распространяются их возможности, и как это можно использовать во благо развития своего сайта.

Сегодня речь пойдет о двух поисковых алгоритмах разных поисковых систем, но направленных на одну цель (главную цель всех поисковых систем) – понять, что именно ищет человек, задав тот или иной поисковый запрос, и предоставить релевантный исчерпывающий ответ, который удовлетворит потребности ищущего.

Представьте ситуацию – вы что-то ищете, но не знаете как точно это называется и вбиваете в поисковую строку всё, что хоть как-то может описать объект поиска.

b_5c7ce04b5d7b6.jpg

Чаще всего в этом случае вводятся longtale-запросы (или «длиннохвостые», низкочастотные запросы, состоящие из более 3-4 слов):

b_5c7ce059d9413.jpg

Раньше поисковики выводили в результатах ответы, в которых было больше всего вхождений из запроса пользователя.

Но часто случалось, что такие результаты совсем не отвечали на запрос пользователя:

b_5c7ce07564d50.jpg

Поисковикам нужно было как-то научиться понимать, что конкретно ищет человек, вбивая ту или иную фразу в поиск, самую суть запроса. Помочь в этом поисковым системам может искусственный интеллект, или как его еще называют – машинный интеллект.

Google RankBrain

Для начала оглянемся назад в 2013 год и обратим своё внимание на блог компании Google, а именно, на новость от 14 августа: https://opensource.googleblog.com/2013/08/learning-meaning-behind-words.html

Новость с загадочным заголовком Learning the meaning behind words – «Понять смысл слов».

В двух словах: данная статья рассказывает о прогрессе в области машинного обучения и технологиях распознавания речи.

Приводится интересный эксперимент recognize cats (and many other objects) по распознаванию кошек и других объектов. Эксперимент закончился успехом – просмотрев более миллиона случайных скриншотов из YouTube алгоритм с использованием нейронных сетей смог распознать и построить лица людей и морды кошки. При том, что первоначальных параметров о том, как выглядят объекты, алгоритм не имел:

b_5c7ce08f2962f.jpg

Но нас больше интересует вторая часть данной статьи, в которой рассказывается про технологию машинного обучения и обработку текстовой информации Word2Vec.

Данная технология занимается поиском связей между словами. Word2vec разбирает текст таким образом, чтобы найти сходства между понятиями.

Например, он понимает, что Париж и Франция связаны так же, как Берлин и Германия (столица и страна). На диаграмме ниже показано, насколько хорошо данная технология может разобрать города по странам, просто прочитав множество новостных статей – без участия человека.

b_5c7ce09f0c4b0.jpg

У многих сейчас возникает вопрос, каким образом это все относится к RankBrain?

Дело в том, что RankBrain – это название системы искусственного интеллекта, созданной на базе алгоритмов машинного обучения. Своим действием RankBrain очень похож на Word2Vec.

RankBrain помогает обрабатывать результаты поиска. Смысл работы алгоритма следующий: так же, как Word2Vec, RankBrain ищет связи понятий, которые поисковый робот может распознать. Когда алгоритм встречает незнакомые для себя слова или фразы, он начинает искать и разбирать подсказки.

Таким образом, он пытается осознать, какие синонимы имеются по данному запросу. Найденные аналогии и ложатся в основу при фильтрации результатов.

Затем алгоритм сопоставляет поведенческие факторы пользователей по предложенным им результатам. И сортирует результаты, убирая неподходящие.

Возможно, это покажется непонятным и замысловатым, но чуть ниже покажем на конкретных примерах, и все встанет на свои места. А пока пару слов скажем о Яндексе.

Яндекс «Палех»

2 ноября 2016 компания Яндекс анонсировала свой новый алгоритм «Палех»:

b_5c7ce0b048719.jpg

Более подробно об Алгоритме «Палех» можете прочитать в нашей статье. Суть работы нового алгоритма очень схожа с RankBrain.

Чтобы не уходить в дебри теории, рассмотрим на примерах работу данных алгоритмов и оценим, кто из поисковых систем ответит лучше на наши запросы.

Раунд первый

Вбиваем запрос: «Кто является самым высоким млекопитающим». Видим следующие результаты выдачи:

Google

b_58b7ba571e3ae.jpg

В выдаче видим общую информацию о крупных млекопитающих, в первом источнике видно, что это Жираф.

Яндекс

b_5c7ce0cf76b14.jpg

Яндекс только на 4-м месте предоставляет верный интересующий нас ответ и то только по прямому вхождению.

Безусловно, в самом источнике, который Яндекс показывает на первом месте в результате выдачи, говорится о том, что это Жираф, но в сниппете информация об этом не отражена. Плюсуем Гуглу.

Раунд второй

Запрос: «Вид спорта при котором штанга поднимается с груди спортсмена».

Google

b_5c7ce0e154f11.jpg

На первом месте четкий ответ – тяжелая атлетика. Браво! Смотрим, что в Яндексе:

Яндекс

b_5c7ce0fbbebca.jpg

Выдача очень похожа. Ставим «плюс» как Яндексу, так и Google. Ответ на запрос есть на 1-м месте результатов выдачи.

Раунд третий

Усложним игру. Возьмем запрос «Жена Трампа»:

Google

b_5c7ce1513d663.jpg

Яндекс

b_5c7ce161ef314.jpg

Что Яндекс, что Google дали нам ответ. В выдаче Яндекса у нас отработал колдунщик, а в Гугле – быстрые ответы. Но в выдаче Гугла видим, что в сниппете на первом месте у нас выделено именно то, что мы ищем.

Раунд четвертый

Поможем Яндексу, возьмем запрос, который сам Яндекс анонсировал при запуске Палеха: «Фильм про человека который выращивал картошку на другой планете». Что на этот запрос ответит Гугл?

Google

b_5c7ce17fd920a.jpg

Ответ четкий и однозначный – Марсианин. Что насчет Яндекса?

Яндекс

b_5c7ce1927c184.jpg

Как мы видим, выдача Яндекса в данном случае «забита» новостями об алгоритме, хотя информация о фильме и представлена в блоке справа.

Раунд пятый

Последний запрос возьмем коммерческий. Прикинемся блондинкой, вобьем запрос: «купить инструмент для проделывания дырок в бетоне небольшого размера»:) Итак, что скажет Гугл?

Google

b_5c7ce1afe8fd5.jpg

Google на первом месте показывает статью о видах инструментов для сверления отверстий в бетоне, в общем-то – неплохо. Хотя ответ не совсем релевантен: мы всё-таки хотели купить, а не почитать о нём.

Яндекс

b_5c7ce1b7913aa.jpg

А в Яндексе почему-то релевантнее оказалась статья про дыроколы для кожи... Полный разгром и победа за google.

Выводы

Хотя в нашей битве алгоритм Палех и проигрывает RankBrain, но не стоит забывать, что эти алгоритмы являются самообучающимися, а алгоритм Яндекса по времени был запущен намного позже алгоритма Google.

Возможно, в скором времени ситуация изменится.

Что с SEO?

Также хочется отметить, что запуск данных алгоритмов открывает новые реалии в области SEO. Во-первых, RankBrain является третьим по важности сигналом ранжирования.

Во-вторых, Палех и RankBrain наконец-то дают возможность владельцам сайтов писать тексты именно для людей, а не для поисковых машин, и быть в ТОПе.

Рекомендации для вебмастеров от Gary Illyes, о том как оптимизировать свой сайт под RankBrain, можно озвучить следующим образом:

«Если вы писали тексты для людей, используя язык, который вы обычно используйте при общении, то будьте уверены – ваш ресурс уже оптимизирован под RankBrain».

О том, что надо писать для людей и создавать сайты именно для них, поисковые системы говорят уже более 15 лет. Надеемся, что скоро это станет повсеместной реальностью.

+2
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Екатерина К
Спасибо за статью, очень интересно! Все же не совсем понятно, а как в реальности использовать Word2Vec - чтобы устанавливать смысл текста.
Ответить
1PS.RU
Агентство комплексного продвижения сайтов
Ксения Захарова
Пример использования данной модели на русском языке хорошо проилюстрирован на веб-сервисе RusVectōrēs: http://rusvectores.org/ru/
Ответить
Екатерина К
Спасибо за ссылку, посмотрю.
Ответить
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.