Главное Авторские колонки Вакансии Образование
2 403 10 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Как не обвалить трафик издания-миллионника

Анна Павлюк, наш SEO-специалист, рассказала о продвижении сайтов СМИ на Single Page Application. Статья пригодится SEO-специалистам и фронт-енд разработчикам, которые хотят научиться работать вместе.
Мнение автора может не совпадать с мнением редакции

Мы работаем с поисковой оптимизацией интернет-изданий уже три года. В начале 2017 два сайта перезапустились на Single Page Application, на фреймворке Angular 2, чтобы ускорить загрузку страниц.

Домены и названия изданий не можем назвать из-за NDA. Условимся, что site1.ru – глянцевое издание для мужчин, а site2.ru – для женщин.

Что такое SPA

Вкратце о SPA (Single Page Application) для тех, кто не сталкивался. Большинство сайтов в интернете – статичные, есть сайты с динамической подгрузкой – сделанные на AJAX. А есть SPA, где страница строится на стороне пользователя, а не сервера, и это ускоряет взаимодействие. Такой тип работы фронтенда используют Яндекс.Карты, Gmail, Meduza, Airbnb, Coursera, Netflix.

Опасность для SEO

Разработчики ценят Single Page Applicatio за уменьшение времени переходов между страницами, нагрузки на устройство и сервер.

Страницы после перезапуска сайтов действительно стали загружаться быстрее:

b_5a2e771e68884.jpg

Но далеко не всегда такие технологии успешно работают в связке с поисковыми системами.

b_5a2e7f1d85ec0.jpg

Чем отличаются сайты на Single Page Application от традиционных

Сайты на Single Page Application сложно индексировать. Контент, который видит пользователь, отсутствует в пригодном для индексирования виде, – он подгружается отдельно через JavaScript. В итоге страницы не попадают в поиск, поскольку поисковый робот не видит контент, либо индексируется только главная страница.

Чтобы выработать рекомендации для перезапуска site1.ru и site2.ru, мы искали сайты, которые работали изначально на SPA или перешли на него и получили в итоге больше трафика, чем было. Таких примеров не нашли и обратились к справке поисковых систем.

Официальные рекомендации поисковых систем

Яндекс рекомендует использовать ?_escaped_fragment_= в URL и метатег в коде динамической страницы, чтобы сообщить боту о наличии HTML-версии страницы. Чтобы проиндексировать http://site1.ru/example/, боту нужна страница http://site1.ru/example/?_escaped_fragment_= с идентичным содержимым.

Google утверждает, что умеет обрабатывать страницы SPA-сайтов и без ?_escaped_fragment_=. На момент принятия решения у нас не было четкой уверенности, что это на 100% так, поскольку на форумах писали о проблемах с индексацией. Решили не рисковать трафиком.

Теоретически, можно определять user-agent и отдавать им разные варианты: «Яндексу» и Mail.ru – с ?_escaped_fragment_=, Google – без. Динамические версии тогда будут отличаться наличием или отсутствием , но нам это показалось лишним усложнением.

В итоге мы дали разработчикам рекомендации использовать ?_escaped_fragment_= в URL и метатег в коде динамической страницы для всех поисковых систем.

Трафик после перезапуска

Сайты перезапустили, частично внедрив рекомендации и несколько позже исправив технические ошибки. Трафик не только не вырос – он упал.

На site1.ru в январе 2017 г. небрендированный трафик увеличился на 78,42% по сравнению с тем же месяцем прошлого года. Сайт перезапустили 17 февраля. В мае 2017 трафик ушел в минус на 2,55%.

b_5a2e7f1db1051.jpg

На site2.ru трафик упал более резко и драматично. В феврале 2017 г. был прирост небрендированного трафика на 23,64% по сравнению с 2016 г. Сайт перезапустили 10 марта. В мае 2017 трафик ушел в минус на 29,27% (по сравнению с 2016 г.).

b_5a2e7f1dda730.jpg

Почему трафик упал

Корень всех бед – некорректный рендер страниц и использование ?_escaped_fragment_=.

HTML-версии обновлялись редко – раз в одну-две недели. Контент выходит, ссылки на новые статьи появляются на страницах рубрик и главной, но долго индексируются, поскольку бот просто не видит их на неактуальных HTML-снимках. В итоге, недополучили трафик по свежим материалам.

У некоторых архивных материалов и страниц-тегов HTML-версия была пустой – такие страницы просто выпали из поиска и, соответственно, перестали приносить трафик.

Сайты медленно индексировались не только из-за задержки рендера рубрик и главной страницы. Рекомендуемая «Яндексом» схема индексации с использованием ?_escaped_fragment_= затрудняет обход сайта: на одну статью – два URL, краулинговый бюджет расходуется быстрее, и свежий контент относительно долго не попадает в поисковую выдачу.

Нашли решение

Отказались от ?_escaped_fragment_= и по адресу динамической страницы стали отдавать ботам Яндекс, Google и Mail.ru сразу HTML-версию страницы.

На site1.ru также внедрили HTTP-заголовки Last-Modified и If-Modified-Since.

Вкупе это положительно повлияло на обход страниц ботом.

b_5a2e7f1e1532d.jpg

Бот успевает обойти больше страниц, и трафик вырос (см. период с июня по октябрь).

b_5a2e7f1e3bbb5.jpg

Советы по продвижению сайта на SPA

  1. URL-адреса сохраняйте в текущем виде. Не заморачивайтесь с ?_escaped_fragment_= и по адресу динамической страницы отдавайте ботам Яндекс, Google и Mail.ru HTML-снимок.
  2. Чтобы не использовать ?_escaped_fragment_=, при выборе фреймворка ориентируйтесь на то, поддерживает ли он серверный рендер. Спойлер: поддерживают почти все. Реализация серверного рендера для Angular, React, Vue.
  3. Проверяйте ответы заголовков сервера. Ответы 200 и 404 должны корректно отдаваться для существующих и несуществующих страниц, соответственно.
  4. На страницах разделов добавьте ссылки на пагинацию в отрендеренных версиях страниц. А на страницах пагинации – например, http://www.site.ru/example/page-2/ – должна быть ссылка на начальную страницу раздела как на каноническую в виде тега <link rel=”canonical” href=”http://www.site.ru/example/”>.
  5. Если будет происходить кэширование, обновляйте кэш на хабовых страницах (главная и разделы) после каждого выхода свежего контента. Если нельзя – не менее 4–5 раз за сутки. Это поможет быстро индексировать новые страницы.
  6. Используйте инструмент «Посмотреть как Googlebot» в Search Console, чтобы понять, корректно ли бот видит страницу и какие компоненты JS или CSS ему недоступны.
  7. Подумайте над решением, которое позволит вовремя находить страницы с проблемами рендера. Мы столкнулись с тем, что некоторые страницы рендерятся, но при этом пустые и отдают код 200 OK. Можно реализовать механизм, который будет, например, проверять наличие заголовка H1 на странице после рендера и отправлять разработчикам уведомление, если его нет.
  8. Если ваш сайт еще не на SPA, и вы только готовитесь к перезапуску, делайте все на тестовом домене, закрытом от индексации. Не переносите на основной, пока не убедитесь, что все рекомендации корректно реализованы.

Выводы

Прежде чем решить, использовать ли SPA, взвесьте за и против. Подумайте, так ли важны конкретно для вас его преимущества, есть ли время и кадры на оперативную реализацию технических задач. Если да, то почему бы и нет – нюансы вы уже знаете.

Полезные ссылки

  1. Константин Носов про некоторые подводные камни Angular Universal.
  2. Презентация Рамазана Миндубаева «Продвижение сайтов на базе Single Page Application».
  3. Дмитрий @mrded про переход на SPA c Drupal и откат обратно.
  4. Список сайтов, использующих фреймворк React.

Статья впервые опубликована на SEO News.

0
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
iBurattino
Синхронизация товаров между интернет-магазином и «Товарами ВКонтакте»
Александр Аббасов
Вы как-то запутанно всё объяснили. Ваша основная проблема оказалась в том, что просто не делали прегенерацию своих статей. Более того, команда понимала, что будет заходить поисковик, а свежий материал ещё не сгенерирован.

И какой смысл серверного рендера? Зачем тогда было делать SPA? С таким подходом Вы заменили свой старый шаблонизатор на новый. А весь смысл как раз в том, чтобы рендеринг происходил на клиенте, поскольку у клиента обычно больше ресурсов, чем на сервере.
Ответить
Показать предыдущие комментарии
Артём Шкуренко
В статье как-раз описана ситуация, что случится, если следовать рекомендациям поисковиков.

Суждение про большее количество ресурсов у клиента верное, но не совсем корректное. Самые ресурсоёмкие процессы при построении страницы: Style recalculation, Layout and Paint. Они происходят только на клиенте. Так-же есть подгрузка ресурсов, их парсинг и построение dom. Серверный рендер только подготавливает страницу, чтобы можно было построить dom, без подгрузки ресурсов. Соответственно это влияет на скорость отображения страницы.

Также не корректно приводить пример с двумя шаблонизаторами. СПА решает совсем другие проблемы, например, скорость и экономию ресурсов при переходах между страницами и выстраивание единой архитектуры проекта для сервера и клиента. Фреймоврки СПА в большинстве ситуаций работают только на клиенте, но могут работать и просто на сервере без клиента — зависит от задачи.
Ответить
iBurattino
Синхронизация товаров между интернет-магазином и «Товарами ВКонтакте»
Александр Аббасов
Спасибо, конечно за ликбез ) Но зачем Вы мне это рассказываете? ) Вы же, по факту, профакапили то, что поисковики не получали свежий контент. И второе, путаете как криво разрабатывать SPA. Коллеги, может Вы уже прекратите самоотрицанием заниматься?))
Ответить
iBurattino
Синхронизация товаров между интернет-магазином и «Товарами ВКонтакте»
Александр Аббасов
И да, реально не обижайтесь. Я понимаю, что мои комментарии не очень Вам нравятся. Я просто хочу, чтобы Вы поняли - Вы написали статью для PR, но не этично свои промахи выворачивать так, чтобы все думали, что это дело в поисковиках и что нет реальных SPA приложений (потому, что я не думаю, что Вы реально потратили дни и недели на анализ под давлением времени на работу).
Ответить
Вдохновляющие инвестиции
Сервис для инвестирования в отрасли будущего
Баринова Дарья
Александр, мы вам аргументы — вы нам «Не обижайтесь, коллеги, вы не правы». Мы не обижаемся, не переживайте. А еще не видим смысла продолжать ваш монолог. Спасибо, что уделили время! : )
Ответить
iBurattino
Синхронизация товаров между интернет-магазином и «Товарами ВКонтакте»
Александр Аббасов
Хорошо, продолжайте в том же духе :)
Ответить
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.