редакции Выбор
YouTube на основе фактов: пусть блогеры не морочат вам голову

Обратился за помощью к коллегам: Яценко Александр помог автоматизировать сбор статистики, Михаил Петренко подсобил с обработкой данных. Задачу сформулировали так: создать метод прогноза достижимости количества просмотров на произвольных YouTube-ресурсах.
Собрали статистику по роликам для каналов, потенциально пригодных для продвижения бренда (Рис.1). На первый взгляд, лидер очевиден — «Mediametrics» с 41 тысячей просмотров на видео. Однако, основной поток просмотров (59,9%) генерирует канал «Романенко. Траблшутинг».

Рис. 1. Список каналов потенциально пригодных для продвижения бренда
Далее учли даты публикации роликов. У «Mediametrics» с его невероятной эффективностью половина публикаций сделана более трех лет назад, у «Романенко. Траблшутинг» — более 2,8 года назад. Во вселенной YouTube с тех пор многое изменилось.
Проблему сформулировали так: как благодаря исторической статистике каналов выбрать тот, который даст наибольший эффект от просмотров сейчас. 40 тысяч просмотров хорошо, но ждать три года в маркетинге и продвижении личного бренда, как минимум нецелесообразно.
Решили нивелировать влияние срока размещения сюжетов, учтя средние просмотры: разделили общее количество просмотров на количество дней с даты публикации. Модель улучшилась, но, кажется, интерес к роликам должен быть сильно дифференцирован во времени.
Основные просмотры набираются сразу после того, как сюжет выложили, далее тянется длинный хвост остаточного интереса. Как видно на Рис. 2, средние хорошо аппроксимируются логарифмическим уравнением, а просмотры падают пропорционально логарифму времени.
Согласно выявленному тренду интерес к новому видео
стремительно тает в первые месяцы, в дальнейшем переходит к низкому, но
стабильному количеству просмотров. У этой зависимости есть несколько полезных
свойств, которыми мы решили воспользоваться. Рис. 2. Распределение среднедневных просмотров по времени
публикации на примере канала «Олег Брагинский» (данные только после начала
«падения» просмотров) Свойство 1: если по оси Х отложить логарифмы времени,
то кривая аппроксимации превращается в прямую, а прямую просто прогнозировать
(Рис. 3). Рис. 3.
Распределение среднедневных просмотров по времени публикации в логарифмической
шкале Свойство 2: зная динамику среднедневного просмотра,
можно восстановить картину накопления интереса к ролику. Суммарный рост
просмотров также имеет логарифмическую зависимость, но теперь не в падении, а в
росте (Рис. 4). Рис. 4. Накопленные просмотры роликов в зависимости от
давности публикации Зная форму накопления просмотров, можно от среднедневных
просмотров, которые равномерно «размазаны» по всему сроку жизни ролика, перейти
к реальным дневным, ведь итоговая сумма просмотров и дата размещения ролика нам
всегда известны. Теперь, двигаясь по кривой обратно во времени (Рис. 5), мы
можем узнать цифру накопленных просмотров сюжета, например, в 30-й день и последующий.
Разница между ними будет представлять реальную цифру количества просмотров за
31 день существования ролика. Рис. 5. Разница между реальным просмотром ролика за день
(Ежедневное) и рассчитанным от просмотров и количества дней (Среднедневное) С третьей недели среднедневные числа расходятся с реальными,
поскольку прошлые просмотры «затягивает» показатель в прошлое (а там их было
больше). Пришлось построить таблицу коэффициентов, переводящую среднедневные
просмотры ролика в реальные (Рис. 6). Рис. 6. Коэффициенты перехода от среднедневных к реальным
просмотрам YouTube Заметно, что ролики набирают просмотры 20 дней с момента выкладки.
В этот период среднедневной и реальный дневной показатель не сильно отличаются,
поэтому полагаем их равными. Далее интенсивность просмотров резко падает, а
после года с даты публикации коэффициент выходит на плато: почти не изменяется,
и его можно принимать как константу. Вы, наверное, уже извелись вопросами: «Как применять
полученные знания?», «Зачем всё это нужно?», «Кому и какая может быть польза от
подобного исследования?» Польза первая: описанный подход помогает оценить популярность
канала, не искажённую историческими наслоениями, которыми так любят бравировать
влогеры. Применим добытые знания к числам Рис.1 и получим картину фактических
просмотров, представленную на Рис.7: Рис. 7. Расчёт реальных просмотров каналов Оказывается, больше всего реальных просмотров приносит канал
«Олег Брагинский», который по первичному анализу не казался фаворитом. На второе
место выходит ресурс «Романенко. Траблшутинг». Остальные тяжеловесы ушли вниз
списка и с большим отрывом тащатся позади. Польза вторая: просмотры YouTube-сюжетов важны бизнесу как
средство, приводящее потенциальных клиентов. Для этого маркетинговые подразделения
регулярно проводят расчёт коэффициентов конверсии посетителей канала к
посетителям сайта и фактам продаж. Подобные коэффициенты со временем стабилизируются, потому за
их повышение ведётся неустанная борьба. Отслеживая реальные просмотры и зная
коэффициенты конверсии, можно контролировать, а главное управлять потоком
клиентов от каналов влогеров. На дату анализа суммарно все ролики за день посмотрело 1’094 человека (Рис. 8, последний столбец). Представим, что у компании
есть KPI на охват аудитории видеоматериалами (и вшитой рекламой) в размере 1’000 чел./дн. Сейчас всё
хорошо, план перевыполнен, бюджет не нужен. А как определить момент, когда стоит начинать беспокоиться и
подключать припасённые финансовые ресурсы? С одной стороны, не хочется
расходовать лишние деньги на рекламу, с другой — KPI должен быть выполнен. Зная динамику просмотров во времени, можно спрогнозировать,
когда объём зрителей приблизится к опасной черте. Для нашего примера динамика
реальных просмотров в ближайшие дни, если не делать новых роликов, будет
следующей: Рис. 8. Реальные просмотры канала шт./дн. (после даты
анализа) Через 13 дней KPI будет нарушен, поэтому максимум на десятый
день нужно публиковать новый материал, который доберёт просмотры, поддерживая ежедневную
цифру. Свежий ролик должен ежедневно давать больше просмотров, чем падает общий
уровень старых, и это достижимо. Польза третья: теперь знаем для какого канала следует
создавать ролики, выполняя KPI за минимальный бюджет. Мы можем на «машине
времени» возвращаться назад и подглядывать сколько просмотров накапливали
сюжеты в момент максимального интереса. И теперь мы точно знаем, что на максимум роста ролики
выходят на 14 — 20 день публикации: Рис. 9. Реальные просмотры
в день в точке максимального роста ролика Любой канал из рассмотренных подходит для удерживания KPI на
десятый день, исходя из формулы («Просмотры на i-й день» — «Просмотры на j-й день») / «Количество
дней между j и i»: (1’008 — 999) / (13 — 10) = 3 чел./дн. Ежедневный рост просмотров выше 3-х чел./дн. в течение 21-го
дня обеспечивают все (Рис. 9, последний столбец). Остаётся вопрос оптимизации
расходов. Каждый канал запросит свою цену за предоставление площадки для
ролика. Стоит выбрать тот, у которого одно из двух соотношений будет
минимальным: · «Цена»/ «21 день» · «Цена» / «Дней до граничного значения KPI». Первый подход очевиден: все каналы дадут рост достаточный
для KPI на протяжении 21 дня, поэтому можно выбрать самый дешёвый. Второй — сложнее:
по нему, скажем, «Mediametrics»
в одном ролике даст такой рост, что обеспечит выполнение KPI в течение года. Завершая публикацию, отметим наших героев — программы, без
которых подобные изыскания были бы невозможны: · MS SQL Server 17: · Оболочка «Orange 3» для визуального интеллектуального анализа данных на Python сценариях: А в следующей публикации опишем
какие параметры статистически обрекают YouTube-сюжеты на гарантированный
успех.