Главное Авторские колонки Вакансии Образование
😼
Выбор
редакции
838 0 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Зависит ли количество показов сайта в поиске Google от погоды? Пример отчета

Некоторое время назад один из моих клиентов попросил изучить корреляцию показов сайта от погоды. Вопрос звучал так: «Зависит ли количество запросов сайта в поиске Google от погоды в этот день?» Хороший вопрос так-то, да? И я решила разобраться.
Мнение автора может не совпадать с мнением редакции

Так как я не могу раскрывать информацию клиента, для статьи я заменила данные о количестве поисковых запросов на показатели другого сайта, большая часть трафика на который идет из Москвы. А бизнес клиента находится в Лондоне, поэтому данные о погоде мы использовали для Лондона. В результате я получила отчет с корреляцией запросов российского сайта оказания услуг от погоды в Лондоне. Не очень логично, но я хочу рассказать о том, как я делала отчет, а не поделиться реальными цифрами. Поэтому, если вам это понравится и будет актуально, то всегда можно подставить шаблон реальные данные.

Итак, поехали.

Какие наборы данных используем на входе

Документ с тестовыми данными можно найти по ссылке.

Для анализа мы выбрали период с начала 2020 года до 16 июня 2021, то есть 1,5 года.

Данные о поисковых запросах я получила из Google Search Console, поле Impressions. С помощью коннектора для Google Sheets выгрузила данные на вкладку «Impressions». Данные сразу же находятся в удобном формате и требуют преобразований. У нас таблица с двумя столбцами: дата и количество показов сайта в поиске Google.

Данные о погоде можно найти на различных сайтах. Мне их уже в готовом виде прислал клиент, но данные можно найти на различных сайтах, например, на www.meteomatics.com с доступом через API и бесплатным тестовым периодом на 14 дней. Если вам, так же как и мне, данные нужны разово, то бесплатного тестового периода будет вполне достаточно.

На входе я получила 3 вкладки в Google Sheets с данными по часам:

  1. Температура на вкладке High Temp by the hour
  2. Дождь — вкладка Rainfall by the hour
  3. Облачность — Cloud Cover by the hour

Преобразования данных о погоде

Данные о погоде и данные о показах сайта в поисковой выдаче имеют разный уровень детализации и мы не можем просто взять и сравнить данные о погоде по часам с показами сайта в разбивке по дням. Поэтому я решила построить сводные таблицы для каждого показателя погоды и группировать данные по дням.

Так как дождь может быть только в определенные часы и облачность также может быть в какое-то время суток, а в какое-то нет, я расчитала среднее значение для каждого показателя. По температуре я сделала 2 среза — среднее за день и максимальная температура за день.

Трафик ночью сильно ниже, чем днем, поэтому я решила убрать из анализа данные с 1 ночи до 6 утра, как не релевантные.

Сначала я свела данные из 3-х вкладок с погодой в одну «weather_hour» и перевела дату из формата Timestamp в отдельные колонки с датой и временем. Формулы для Google Sheets такие:

Исходные данные:

Timestamp A2 = 20200101T0000

Преобразуем:

Date B2 = date(left(A2,4),mid(A2,5,2),mid(A2,7,2))

Time C2 = =time(mid(A2,10,2),right(A2,2),0)

Следующие 3 колонки — температура, дождь и облачность подставила данные из исходных вкладок с помощью ВПР.

Формулы:

High Temp by the hour D2 = VLOOKUP($A2,’High Temp by the hour’!$A:$B,2,0)

Rainfall by the hour E2 = VLOOKUP($A2,’Rainfall by the hour’!$A:$B,2,0)

Cloud Cover by the hour F2 = VLOOKUP($A2,’Cloud Cover by the hour’!$A:$B,2,0)

Когда таблица с данными по часам сформирована, можно сделать сводную и группировать данные по дням. Результат на вкладке «weather_day». Здесь в фильтре отключаем ночные часы и выбираем нужные для работы колонки. Для температуры создаем 2 столбца — со средним и максимальным значением.

Теперь можем объединить данные в одну таблицу на вкладке «GDS_Impr_Weather». С помощью той же функции ВПР соединяем данные о показах со вкладки «Impressions» и данные о погоде по дням со вкладки «weather_day».

Наш набор данных для визуализации готов. Переходим к картинкам.

Визуализация данных в Google Data Studio

Шаблон отчета можно посмотреть по ссылке.

На первой странице представлены данные только за прошлый месяц. На верхних графиках линией представлены показы сайта в поиске и столбцами средняя и максимальная температура в этот день. Даже на таком графике уже видно, что при понижении температуры количество показов сайта было выше.

На второй строке с данными об осадках и облачности закономерности на первый взгляд не заметно.


Зависит ли количество показов сайта в поиске Google от погоды

Далее я решила построить графики корреляции, на каждый из которых добавила линейную линию тренда. Линия тренда более наглядно показывает, что при повышении температуры количество показов сайта в поиске понижается. Для осадков и облачности также есть незначительная корреляция, но она более слабо выражена.


На второй странице отчета я вывела те же графики, но за весь период — 1,5 года. В целом, картинка повторила данные за май, кроме облачности. На большом промежутке времени заметно небольшое повышение количества показов сайта в те дни, когда небо затянуто тучами или облаками. Ну и в целом, точек на графике стало больше и данная выборка может считаться более релевантной.


Зависит ли количество показов сайта в поиске Google от погоды

Строим матрицу корреляций

Можно было бы остановиться и на этом, но мне стало интересно построить общую матрицу корреляций, для чего я воспользовалась библиотеками Python для статистики и визуализации данных. Документ можно посмотреть по ссылке.

Я загрузила те же данные, которые использовала для визуализации в Google Data Studio. Построила гистограммы для каждого параметра. В целом, это было не нужно, но интересно посмотреть на равномерность распределения данных. Кстати, интересный факт, что гистограмма температуры имеет близкое к нормальному распределение.


Зависит ли количество показов сайта в поиске Google от погоды — графики распределения

Так как данные представлены в разных единицах измерения, я их нормализовала и построила матрицу корреляций.


На основе данной матрицы можно сделать следующие выводы

  1. Существует слабая корреляция между облачностью и показами сайта. В облачный день с вероятностью 5-10% можно ожидать повышения количества показов сайта в поиске.
  2. Более ярко выражена обратная корреляция с температурой. Здесь уже с вероятностью 25% можно утверждать, что в жаркий день показы сайта будут уменьшаться и наоборот, в прохладный увеличиваться.
  3. И еще один интересный вывод, что в облачные дни с вероятностью 30% температура будет ниже, а вероятность дождя, в среднем 25%.

И что мне с этим делать?

На тестовых данных уровень корреляции показов сайта и погоды не слишком высокий, но если взять реально работающий сезонный бизнес, то такой анализ может помочь эффективнее работать с рекламными каналами. Например, можно увеличивать или уменьшать рекламный бюджет в зависимости от прогноза погоды.

Если вам понравился мой пример, можете повторить его на своих данных и посмотреть как погода влияет на ваш бизнес.

+1
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.