редакции Выбор
Как проложить кратчайший путь на вершину YouTube
Опытные блогеры и начинающие пользователи сети действуют вслепую, надеясь на художественность оформления каналов и роликов. Читают тайные форумы, используют покупные плагины, нанимают гроусхакеров, надеясь на мгновенный взлёт популярности, не стыдятся закупать таргетированную рекламу.
Специализированные агентства и фрилансеры обещают золотые горы под разумный бюджет, но по факту перенаправляют половину средств третьим исполнителям, превращаясь в квалифицированных спекулянтов. Странно наблюдать всё это, находясь на территории, которая когда-то славилась крутыми программистами.
С Александром Яценко, коллегой по «Бюро Брагинского», решили показать класс и сформулировали задачу:
- разработать инструмент, регулярно собирающий статистику YouTube-канала
- создать алгоритм подбора сильных слов для названий, описаний, тегов
- научиться прогнозировать просмотры, лайки, дислайки, комментарии.
Итогом исследования предположили технологию, помогающую заполнять текстовые поля видеороликов лучшими фразами по оценке самой сети. Наверняка подобный инструмент могут создать ещё несколько команд в мире, но пускать его в бой мало кто решится, ведь в таком случае соперничество тут же закончится.
Да, признаём, что обошли вниманием вопросы оформления самого канала: шапки и описания, видеовизитки и тегов, создания плейлистов и сортировки видео в горизонтальных рядах, но кто сказал, что мы к этому не вернёмся на следующей итерации, тем более что множественные задумки и значительные наработки уже есть.
Решили не громоздить сложные конструкции, а «починить забор» с помощью палочки и верёвочки. На этот раз отказались от макросов, вспомнив про Python, предлагающий сотни готовых библиотек. Обилие заготовок обнадёжило, но найти подходящие оказалось делом нетривиальным: На вход скрипту передаём ссылку на YouTube-канал стоматолога-ортодонта Инессы Брагинской: Собираем перечень плейлистов, для каждого формируем список видео, для роликов сохраняем: После выгрузки собранной информации в Excel получаем первый полезный эффект — становится доступна проверка орфографии. Названий роликов и ошибок, мешающих поиску, оказывается немало: Вторая находка — пропущенные нумерованные видео, недоступные сюжеты, дублированные ролики в плейлистах. Особо не мешает, но и на пользу точно не идёт: Третьей победой стало программирование сбора информации канала, настроенного через планировщик заданий Windows на ежедневный сбор показателей в 12:00... ... с сохранением в базу данных SQL Lite для последующего анализа: Четвёртым шагом построили температурную карту тегов при описании видео — стала отчётливо видна классическая ошибка новичков: использовать слабые однородные слова для всех роликов плейлиста, вместо того чтобы тщательно подбирать индивидуальные ключевые слова к каждому сюжету: Пятым этапом собрали статистику поисков тегов в Гугл и YouTube, чтобы оценить количество релевантных результатов, после чего повторили операцию для роликов, которые оказывались выше в выдаче при использовании браузера в режиме «инкогнито», что позволило найти «улучшенные» ключевые слова: На шестой ступени оценили распределение роликов по seo-корзинам: На седьмом уровне изучили теги третьей корзины... ... и, варьируя параметрами сортировки, подобрали лучшую очерёдность ключевых слов... ...создали таблицу групповых замен тегов по маске названий... ... для видео первой корзины: ...при которой SEO-оценка роликов сразу же становилась не менее чем 48.7... ... улучшив корзинную статистику: Восьмой очередью запустили анализ тегов под видео, которые выдавал YouTube в ответ на уже собранные нами ключевые слова: Удалив очевидно неподходящие, провели оценку всех слов-претендентов под каждым видео из первой корзины: Девятым подходом занялись исследованием роликов, получивших SEO-балл выше ожидаемого. Вставляли по одному ключевому слову, чтобы зафиксировать его силу под конкретным видео. Гипотеза оказалась верна: тот же тег под разными роликами приобретал силу от 0 до 13.1 баллов: Десятым шагом стала попытка вставлять под «не взлетевшими» видео первой корзины... ... сортированную очерёдность индивидуально оценённых тегов с попыткой удаления последних для поиска строки пикового seo-значения... ... что дало новые сдвиги: Температурная карта ключевых слов предсказуемо улучшилась: Как, впрочем, и распределение по seo-корзинам: В ходе эксперимента удалось повысить seo-качество канала на 14,5%: Переместить все отстающие видео во вторую корзину не вышло из-за слабости найденных тегов, но мы обязательно продолжим эксперименты, тем более что все требуемые программные инструменты уже созданы: Кстати, стоматологам на заметку: Читайте также: Программирование на Python: особенности обучения, перспективы, ситуация на рынке труда Бесплатные курсы программирования от самых лучших ВУЗов мира: подборка