Главное Свежее Вакансии   Проекты
😼
Выбор
редакции
18 558 6 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Как проложить кратчайший путь на вершину YouTube

Основатель «Школы траблшутеров» Олег Брагинский рассказал про разработку алгоритма для подбора сильных названий, описаний и тегов к видеороликам. В ходе эксперимента удалось повысить seo-качество канала на 14,5%.

Опытные блогеры и начинающие пользователи сети действуют вслепую, надеясь на художественность оформления каналов и роликов. Читают тайные форумы, используют покупные плагины, нанимают гроусхакеров, надеясь на мгновенный взлёт популярности, не стыдятся закупать таргетированную рекламу.

Специализированные агентства и фрилансеры обещают золотые горы под разумный бюджет, но по факту перенаправляют половину средств третьим исполнителям, превращаясь в квалифицированных спекулянтов. Странно наблюдать всё это, находясь на территории, которая когда-то славилась крутыми программистами.

С Александром Яценко, коллегой по «Бюро Брагинского», решили показать класс и сформулировали задачу:

  • разработать инструмент, регулярно собирающий статистику YouTube-канала
  • создать алгоритм подбора сильных слов для названий, описаний, тегов
  • научиться прогнозировать просмотры, лайки, дислайки, комментарии.

Итогом исследования предположили технологию, помогающую заполнять текстовые поля видеороликов лучшими фразами по оценке самой сети. Наверняка подобный инструмент могут создать ещё несколько команд в мире, но пускать его в бой мало кто решится, ведь в таком случае соперничество тут же закончится.

Да, признаём, что обошли вниманием вопросы оформления самого канала: шапки и описания, видеовизитки и тегов, создания плейлистов и сортировки видео в горизонтальных рядах, но кто сказал, что мы к этому не вернёмся на следующей итерации, тем более что множественные задумки и значительные наработки уже есть.

Решили не громоздить сложные конструкции, а «починить забор» с помощью палочки и верёвочки. На этот раз отказались от макросов, вспомнив про Python, предлагающий сотни готовых библиотек. Обилие заготовок обнадёжило, но найти подходящие оказалось делом нетривиальным:


На вход скрипту передаём ссылку на YouTube-канал стоматолога-ортодонта Инессы Брагинской:


Собираем перечень плейлистов, для каждого формируем список видео, для роликов сохраняем:

  • количество просмотров, лайков и комментариев
  • название, длительность и дату публикации
  • текстовое описание и список тегов:


После выгрузки собранной информации в Excel получаем первый полезный эффект — становится доступна проверка орфографии. Названий роликов и ошибок, мешающих поиску, оказывается немало:


Вторая находка — пропущенные нумерованные видео, недоступные сюжеты, дублированные ролики в плейлистах. Особо не мешает, но и на пользу точно не идёт:


Третьей победой стало программирование сбора информации канала, настроенного через планировщик заданий Windows на ежедневный сбор показателей в 12:00...


... с сохранением в базу данных SQL Lite для последующего анализа:


Четвёртым шагом построили температурную карту тегов при описании видео — стала отчётливо видна классическая ошибка новичков: использовать слабые однородные слова для всех роликов плейлиста, вместо того чтобы тщательно подбирать индивидуальные ключевые слова к каждому сюжету:


Пятым этапом собрали статистику поисков тегов в Гугл и YouTube, чтобы оценить количество релевантных результатов, после чего повторили операцию для роликов, которые оказывались выше в выдаче при использовании браузера в режиме «инкогнито», что позволило найти «улучшенные» ключевые слова:


На шестой ступени оценили распределение роликов по seo-корзинам:

  1. к первой отнесли 159 видео, набравших менее 50 баллов (1.1)
  2. ко второй — 0 получивших ровно полусотню
  3. к третьей — 12 рекордсменов (3.1):


На седьмом уровне изучили теги третьей корзины...


... и, варьируя параметрами сортировки, подобрали лучшую очерёдность ключевых слов...


...создали таблицу групповых замен тегов по маске названий...


... для видео первой корзины:


...при которой SEO-оценка роликов сразу же становилась не менее чем 48.7...


... улучшив корзинную статистику:

  1. первая «потеряла» всего 9 видео (1.2)
  2. вторая, как и раньше осталась пустой
  3. третья пополнилась из первой (3.2):


Восьмой очередью запустили анализ тегов под видео, которые выдавал YouTube в ответ на уже собранные нами ключевые слова:


Удалив очевидно неподходящие, провели оценку всех слов-претендентов под каждым видео из первой корзины:


Девятым подходом занялись исследованием роликов, получивших SEO-балл выше ожидаемого. Вставляли по одному ключевому слову, чтобы зафиксировать его силу под конкретным видео. Гипотеза оказалась верна: тот же тег под разными роликами приобретал силу от 0 до 13.1 баллов:


Десятым шагом стала попытка вставлять под «не взлетевшими» видео первой корзины...


... сортированную очерёдность индивидуально оценённых тегов с попыткой удаления последних для поиска строки пикового seo-значения...


... что дало новые сдвиги:


Температурная карта ключевых слов предсказуемо улучшилась:


Как, впрочем, и распределение по seo-корзинам:


В ходе эксперимента удалось повысить seo-качество канала на 14,5%:


Переместить все отстающие видео во вторую корзину не вышло из-за слабости найденных тегов, но мы обязательно продолжим эксперименты, тем более что все требуемые программные инструменты уже созданы:


Кстати, стоматологам на заметку:

  1. диагностика грузовиков пользуется большей популярностью, чем аналогичная процедура во рту
  2. зрители надеются удалить камень, поставить импланты, выровнять и отбелить зубы дома
  3. особую тревогу вызывает прикус, влияющий на самооценку, отношения и личную жизнь.

Читайте также:

Самые востребованные языки программирования в 2020 году: топ-5 от системного архитектора Deutsche Bank

Программирование на Python: особенности обучения, перспективы, ситуация на рынке труда

Зачем изучать Racket

Бесплатные курсы программирования от самых лучших ВУЗов мира: подборка

Как бесплатно изучать программирование на Code Basics

+3
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Первые Новые Популярные
AleksJPopov
Будьте любезны, pip list requirements для всего этого чуда.
Ответить
Олег Брагинский
AleksJPopov, спасибо за предметный вопрос!
Package Version
-------------- ---------
altgraph 0.17
et-xmlfile 1.0.1
future 0.18.2
google-api-core 1.17.0
google-api-python-client 1.8.0
google-auth 1.14.0
google-auth-httplib2 0.0.3
googleapis-common-protos 1.51.0
jdcal 1.4.1
openpyxl 3.0.3
pefile 2019.4.18
Pillow 7.1.2
pip 20.1
pony 0.7.13
PyInstaller 3.6
pyperclip 1.8.0
python-dateutil 2.8.1
pywin32 227
pywin32-ctypes 0.2.0
selenium 3.141.0
setuptools 45.2.0
urllib3 1.25.9
wheel 0.34.2
Ответить
Kirill Konovalov
Классная статья, спасибо за ваш труд)

А можете рассказать побольше про разбивку по корзинам и ранжирование перспективных слов? Вообще было бы классно услышать от вас рекомендаций на почитать про SEO в Youtube :)

спасибо заранее!
Ответить
Олег Брагинский
Кирилл, спасибо за поддержку! Корзиной назвали seo-вес, которое может получить видео. На предпоследнем рисунки отмечены корзины от 25,7 до 65,0. Читать про SEO в YouTube нечего - просмотрели всё, что могли: кругом догадки людей, не знакомых с математическими методами. Скоро снимем видео и выложим на мой канал ;)
Ответить
Aleksandr Barantsev
Ну хотелось бы в конце увидеть использование опыта на примере. Сделали видео, использовали эти навыки и получили такой-то результат иначе это гипотеза
Ответить
Олег Брагинский
Александр, к счастью, это не гипотеза, а автоматизация способа, обнаруженного опытным путём. На моём канале все видео до единого имеют рейтинг 60 и цифры только растут ;)
Ответить
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.