Выгрузка данных из Яндекс.Метрики и Google Analytics по API — часть 1
После прочтения статей вы научитесь: оптимизировать кампании в Excel методами, которые используются в оптимизаторах конверсий; автоматически собирать семантику, сегментировать и создавать объявления; прогнозировать конверсию на базе истории и многое другое.
Темы статей:
- Выгрузка данных из Google Analytics и Яндекс Метрики по API
- Парсинг ключевых слов в Key Collector
- Кластеризация запросов
- Агрегирование данных
- Прогнозирование конверсии для ключевых слов
- Расчет ставок
- Разработка заголовков
- Разработка рекламных кампаний
- Анализ эффективности
Материал сложный и раскрывает только базовые подходы к автоматизации, чтобы задать вам вектор развития.
Необходимый стек знаний для комфортного чтения: вы без труда можете составить кастомный отчет в Google Analytics и Метрике; парсили и фильтровали ядра в Key Collector; знаете, что такое средневзвешенная; пользуетесь сводными таблицами в Excel; знаете Python, Pandas либо имеете небольшой опыт программирования; знаете, почему в некоторых тематиках слова «кавычат», а в других нет
Итак, начнем! В данной статье мы выгрузим поисковые запросы с конверсиями из Яндекс Метрики, которые впоследствии будем расширять путем кластеризации, отфильтруем их и приведем к лемме. Так же мы выгрузим данные для расчета ставки из Google Analytics.
На текущем этапе сложно объяснить, как конкретно будут использоваться эти данные, но наберитесь терпения, постепенно к вам придет понимание.
Выгружаем данные из Яндекс Метрики с помощью Excel Power Query
Создаем новый запрос
Переходим в режим редактирования
Вставляем код функции запроса
Скопировать код можно по ссылке. Автор кода Максим Уваров, благодарим его!
Вставляем параметры запроса
Подробнее о полях:
- id — ID счетчика Яндекс Метрика
- metrics — метрики, например клики, конверсии, отказы и так далее
- demensions — параметры, в разрезе которых вы хотите видеть метрики, например ключевые слова, кампании, регионы и т.д.
- date1 и dat2 — периодtoken — пароль для доступа к Яндекс Метрики, его вы можете получить по ссылке
- filters — фильтры, например, если мы хотим видеть метрики в разрезе ключевого слова с словом «купить»
- direct_ids — ID аккаунта Яндекс Директ, не знаю для чего он нужен, не сталкивался
Если вы хотите составить свой собственный отчет, назначить фильтры, то вам потребуется ознакомиться с документацией API Метрикиrel="nofollow">>>
В нашем запросе мы использовали следующие параметры:
# метрики количества визитов и количества достижения цели, вместо ХХХХ ID цели metrics = ym:s:visits,ym:s:goaXXXXreaches <span class="redactor-invisible-space"> </span># параметры источника, страницы входа и поисковый запрос demensions = ym:s:lastSourceEngine,ym:s:startURLPathFull,ym:s:lastSearchPhrase # фильтры на органический трафик и исключение брендовых запросов через регулярное выражение filter = ym:s:lastSourceEngine=='organic.yandex' AND ym:s:lastSearchPhrase!~'брендовыйЗапрос1|брендовыйЗапрос2' AND ym:s:lastSearchPhrase!=null
После нажатия Invoke вы увидите превью ваших данных. Если при запросе вышла ошибка, то можем редактировать запрос нажав на шестеренку Source
Если все хорошо, то нажимаем Close and load и загружаем все данные в таблицу.
Яндекс для нас является основным источником трафика, поэтому из Google поиск в рамках статьи рассматривать не будем, чтобы не усложнятьНормализация и фильтрация семантического ядра
Нормализация, это приведение всех слов в единственное число именительный падеж и т.д. Для этого используем сервис K50
Копируем данные из файла lemmas.csv в наш основной файл во вкладку Lemmas. С помощью функции vlookup (в русском Excel ВПР) подтягиваем лемматизированные значения ключевых слов из таблицы lemmas.
Все, задача выполнена!
Фильтрация семантического ядра, чистка
Теперь у нас есть лемматизированный список фраз и нам нужно его очистить от фраз, которые не удовлетворяют требования Яндекс Директ. Для этого добавляем все фразы в Key Collector и нажимаем на иконку фильтра в столбике «Фраза»
Яндекс Директ не принимает в качестве фраз слова с составом более 7 слов и фразы со специальными символами, поэтому удаляем их.
Далее фильтруем слова через список стоп-слов, то есть удаляем из нашего списка фразы, которые содержат стоп-слова. Хороший сборник стоп-слов находится по ссылке
Выгрузка из Google Analytics среднего чека и конверсии по URL
Теория
Согласно свойствам аукциона Яндекс Директ и Google Adwords, для максимизации прибыли нам необходимо в качестве ставки установить ценность клика ключевого словаЦенность клика = Средний чек * Доля маржи в чеке * Конверсия сайта
Есть еще портфельная теория назначения ставок, она позволяет поднять прибыль на 10-20%, но в рамках статьи ее не рассматриваем, чтобы не усложнять.
Что это для нас значит? — Нам нужно собрать исторические данные конверсии и среднего чека в разрезе URL сайта и ключевых фраз. Эти данные мы будем использовать для назначения ставок.
Не можете состыковать, что к чему? Да, это сложновато, но вы все поймете, когда мы в финальной статье соединим все данные в одной формуле. Поэтому обо всем по порядку.
Сначала соберем средние чеки и конверсию по всем URL сайта, это просто. Эти данные мы можем взять из истории Google Analytics. Для этого понадобится Google Spread Sheets и Аддон Google Analytics, который вы можете установить в магазине дополнений.
Создаем новый отчет
Вводим test, выбираем свой счетчик и представление Google Analytic, и нажимаем «Create report»
Вводим конфигурацию отчетов, как на картинке, и нажимаем Run reports. Понимаю, что пояснений к заданными параметрам недостаточно, но это может слишком далеко отвести нас от темы статьи. Подробную информацию вы сможете найти в документации
В нашем запросе мы использовали следующие метрики и параметры:
ga:sessions — количество визитов ga:transactions — количество транзакций ga:transactionRevenue — выручка ga:sourceMedium — канал привлечения ga:landingPagePath — страница входа
Теперь копируем отчеты на новые вкладки и вставляем только значения. Теперь нам нужно изменить точки на запятые, чтобы потом открыть документ в Excel - меняем.
Для числовых значений задаем числовой формат.
Так как параметр ga:sourceMedium дублирует некоторые URL, то строим сводную таблицу. Попутно чистим от нежелательных значений и дублей.
Добавляем новое рассчитываемое поле = 'ga:transactionRevenue' / 'ga:transactions' , это средний чек.
На выходе имеем аккуратную таблицу с URL и средними чеками.
Аналогичные операции проводим и с таблицей конверсии по URL.
Весь документ можно скачать в Excel.
Выгрузка данных Яндекс Директ из Google Analytics
Выгружаем из Google Analytics, как мы делали несколькими шагами ранее. На скрине пример конфигурации отчета. В поле Filters мы используем регулярные выражения.
ga:adContent=~.*search_none.* — отфильтровываем только клики с поиска, исключая РСЯ; при условии, что у вас есть соответствующий параметр в UTM-метке <span class="redactor-invisible-space"> </span>Start Index — начальная строка отчет Max Results — последняя строка отчета <span class="redactor-invisible-space"> </span>Дело в том, что отчет имеет ограничение в 10 000 строк, если у вас больше данных, то вы вызываете один и тот же отчет несколько раз и меняете Start Index и Max Results на 10001 и 20000 и так далее.
На выходе получаем следующее
Все, мы собрали данные, с которыми будем работать в последующих этапах.
Пишите вопросы в комментариях на нашем сайте, какие темы было бы интересно раскрыть подробнее? Если у вас есть идеи или советы, то делитесь!