Как Mediakix пытался “посчитать всех блогеров в мире” и, в итоге, получил вилку с разницей более чем в 10 раз
Отбросим споры о практической пользе подобных расчетов (хотя в целом это может быть действительно интересно для оценки перспектив рынка инфлюенс-маркетинга, разработчикам IM-платформ и т.д.), и признаемся - в первую очередь, это ответ на вопрос "сколько же их всего?"
Мнение автора может не совпадать с мнением редакции
Исследователи из американского агентства Mediakix, специализирующегося на инфлюенс-маркетинге, провели исследование, цель которого — выяснить, сколько всего в мире существует инфлюенсеров. Чтобы немного упростить задачу, авторы решили ограничиться тремя платформами, на которых базируется большая часть лидеров мнений: Instagram, YouTube, TikTok. Результат получился следующий: где-то от 3 до 37 миллионов.
Да, мы ожидали увидеть чуть более конкретные данные. Почему такой разброс? Как считали? Или просто взяли цифры из головы?
Команда Ex Libris постаралась разобраться в методологии подсчетов и выяснить, почему итоговая цифра получилась такой, какая она есть.
Сбор данных
Начнем с того, что подсчет инфлюенсеров — задача сама по себе нелегкая. Большинство отчетов, касающихся социальных сетей (в том числе и те, которые публикуют сами площадки, и большие международные проекты типа Global Digital), обычно ограничиваются информацией об общем количестве пользователей социальных платформ и их ранжированием по странам и соцдему.
Исследования с акцентом на инфлюенс-маркетинг чаще делают упор на объемы рекламного рынка, взаимодействия блогеров с брендами, агентствами и биржами, сравнение эффективности рекламных каналов и т.д. Внимание на данных о количестве лидеров мнений, как правило, не заостряется.
В итоге, источниками данных послужили несколько крупных IMP (Influencer Marketing Platform) или, проще говоря, бирж блогеров и сервисов аналитики и поиска — Julius, Tagger, CreatorIQ, HypeAuditor, Influencity и другие.
Фильтры и анализ
Все инфлюенсеры, числящиеся на этих платформах, были выгружены в один общий массив, который предстояло очистить от дублей, фейков и нерелевантных аккаунтов.
В процессе сопоставления данных из разных источников исследователи обнаружили, что у сервисов аналитики и бирж блогеров оценки общего количества инфлюенсеров значительно различаются. Причина: все платформы, предоставившие данные, различаются по масштабу, техническим возможностям, методам поиска и проверки аккаунтов в их системе. К примеру, один сервис располагает базой в 2000 детально проверенных блогеров, а другой может предложить данные о 2 миллионах, но с ограниченной информацией о достоверности профиля.
Отчасти поэтому было принято решение вести подсчет инфлюенсеров в виде оценочных диапазонов на каждый социальный канал. Верхнюю границу установили по наибольшему количеству инфлюенсеров в самой большой из доступных баз, нижнюю — через сравнение данных всех баз и расчет медианного и среднего значений.
Чтобы найти и исключить пересечения, т.е. аккаунты, которые ведут одни и те же блогеры в Instagram, YouTube и TikTok, авторы исследования составили и проанализировали вручную топ 1000 популярных профилей инфлюенсеров на каждой из трех платформ. Тут же исключали и нерелевантные страницы брендов, селебрити и пользователей не-инфлюенсеров.
Далее, нужно было выявить поддельные аккаунты и, в целом, определиться с тем, кого считать лидером мнений.
Разумеется, IMP, которые предоставили свои базы для исследования, сами постоянно ведут борьбу с мошенниками и стараются включать в них только честных и реально существующих блогеров. Однако механизм модерации на биржах и сервисах не совершенен, и чем больше площадка — тем выше шанс, что мошеннический аккаунт останется на ней незамеченным.
Деталей анализа авторы не раскрывают, но можно предположить, что работа заняла не один день, — ведь накрутками показателей в профилях грешат более 50% инфлюенсеров (данные приводит HypeAuditor, который также предоставлял свои базы для проведения данного исследования).
В категорию инфлюенсеров авторы внесли все аккаунты в Instagram, YouTube и TikTok, у которых больше 1000 подписчиков (и которые прошли все фильтры). Социально-демографические характеристики (пол, возраст, язык общения и т.д.) не учитывались.
Наконец, с помощью моделей линейной регрессии были установлены распределения по уровням влияния (mega, macro,mid-tier, micro, nano).