Главное Свежее Вакансии Образование
Выбор редакции:
11 907 33 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Побеждаем реферальный спам в Google Analytics

В последнее время проекты, у которых не так уж много источников трафика наблюдают в Google Analytics кучу непонятных переходов, которые портят статистику и мешают нормальной работе. Давайте избавимся от них раз и навсегда!

В последнее время подобная картина знакома многим (особенно мелким компаниям, у которых в Google Analytics не так уж и много источников трафика):

b_5541e2a3b2de6.jpg

Предприимчивые дельцы генерируют фейковые переходы на сайт и оставляют свой рефферер перехода или источник кампании, в надежде на то, что владелец аккаунта GA обратит на ссылку внимание и решит по ней перейти.

Перейдя по такой ссылке, человека будет ждать какой ни будь сайт, участвующий в одной из CPA сетей (например aliexpress). Разумеется, человек такой сайт закроет, однако, кука посещения у него останется. Весь расчет идет на то, чтобы "заразить" такими куками как можно больше людей и чтобы какая-то часть из посетителей совершила (сразу или в течение 30 дней) целевое действие на этом сайте.

Поскольку, покупать ничего на aliexpress мы не хотим, нужно как-то избавляться от этих ссылок, захламляющих наши отчеты в GA. Ниже несколько способов избавления от спама Google Analytics.

Исключаем источники

С помощью фильтра (не изменяет исторические данные)

Для того, чтобы исключить все ненужные нам источники — создадим новое представление (view), к которому мы применим наш фильтр (показанный на скриншоте):

b_5541e8fba723d.jpg

Последний шаблон фильтра (собраны самые достающие источники) —

darodar\.|semalt\.|buttons-for-website|blackhatworth|ilovevitaly|prodvigator|cenokos\.|free-share-buttons\.|buy-cheap-online\.|googlsucks\.|theguardlan\.|youporn-forum\.|get-free-traffic-now\.|ranksonic\.|adcash\.|simple-share-buttons\.|social-buttons\.|hulfingtonpost\.|best-seo-solution\.|buttons-for-your-website\.
Не забывайте проверять свой фильтр, чтобы не исключить ничего лишнего.
upd: в шаблон фильтра влезает только 255 символов (поэтому проверка может выдавать ошибку), рекомендую разбить строчку на 2 фильтра или же пользоваться расширенным сегментом.

С помощью сегмента (изменяет исторические данные)

Создаем расширенный сегмент с такими настройками:

b_5541eac8290bd.jpgИсключаем в источнике/канале точно такие же источники —

darodar\.|semalt\.|buttons-for-website|blackhatworth|ilovevitaly|prodvigator|cenokos\.|free-share-buttons\.|buy-cheap-online\.|googlsucks\.|theguardlan\.|youporn-forum\.|get-free-traffic-now\.|ranksonic\.|adcash\.|simple-share-buttons\.|social-buttons\.|hulfingtonpost\.|best-seo-solution\.|buttons-for-your-website\.

После применения такого сегмента можно наблюдать существенную разницу в отчетах:

До

b_5541ec99e2cbf.jpg

После

b_5541ec57a1206.jpgРезультат налицо. Надеюсь, эта статья будет полезна небольшим компаниям (стартапам), которые каждый день сталкиваются с этой проблемой.

Если вы знаете еще какие нибудь более удобные и автоматические способы — просьба делиться в комментариях.

+17
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Владимир 1377
Это наблюдается только на вордпресс проектах, у которых подключены плагины. Когда недавно запустил такой, уже решил эту проблему. По-поводу вашего шаблона фильтра "По меньшей мере одно поле содержит недействительные данные. Исправьте их и отправьте форму еще раз."
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин 17579
У нас несколько сайтов не на WP и похожая картина наблюдается. По поводу ошибки, прошу прощения, забыл написать, что в шаблон влезает 255 символов, нужно в 2 фильтра делать.
Ответить
Владимир 1377
странно, у меня 2 проекта на yii своя кмс, 1 на джумле и 2 на вп все на одном хостинге и такое только на ВП где есть плагины, на пустом — нету
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин 17579
А домены на других кмс — старые? У меня есть мнение, что спамят только новые домены, где трафика почти нет и такие переходы гораздо заметнее.
Ответить
Владимир 1377
да, кстати, может тогда стоит предъявлять претензии регистратору? Хотя, непонятный момент, в счетчиках яда их нету.
Ответить
Okkama
Блог о быстром старте проектов
Евгений Болтян
У моего клиента таких туча появилась именно на лендинге. Чистом html лендинге.
Ответить
Igor SnooPeR
Владимир, у меня точно эти же reffers url на друпале тестовом с первого дня запуска
Ответить
eden lane
Tumblr блог, те же источники
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин 17579
Скорее всего парсится база новых доменов и спам идет по ним.
Ответить
Galagram
Интернет проект о китайских гаджетах
Дмитрий Лупич
Рефф спам — это атака не на сайт, а на Google Analtics и Yandex Метрику.

Спемер даже на заходит на сайт, его паук имитирует посещения в самой аналитике. Хоть миллион "уников" реф спама зайдет на сайт — нагрузка на сервер не будет, разве что на сервер Google/Yandex.

P.S. метод не исключает реф спам, а лишь скрывает его в Аналитике, но за статью спасибо
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
А это моя строка для сайта в зоне com:
social-buttons.com|buttons-for-your-website.com|4webmasters.org|googlsucks.com|theguardlan.com|best-seo-offer.com|free-share-buttons.com|sexyteens.hol.es|buy-cheap-online.info|www.Get-Free-Traffic-Now.com|best-seo-solution.com|searches.uninstallmaster.com
Ответить
Владимир 1377
Точка в регулярных выражениях это символ, это строка у Вас вообще работает? Если да то как?)
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин 17579
По хорошему, точки экранировать надо)
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Это загадка но с экранами не работало
Ответить
Владимир 1377
Оно скорей не работает, чем работает. А не работало из-за ограничения по количеству символов в поле, поправку в статье уже сделали по этому поводу.
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Спасибо поправил у себя. А почему точка а не звезда?
Ответить
Владимир 1377
точка один символ, звезда — все
Ответить
Boosta.ru
Сайт об интернет-маркетинге: кейсы, советы, анализ ошибок, обзор сервисов
Andrei 8041
Пытался сделать, как у вас тут описано. но ничего не получилось, к сожалению(
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин 17579
Какую ошибку выдает?
Ответить
Native Connections
Маркетинговые материалы на английском
Хищенко Елена
А эти левые рефералы не понижают рейтинг сайта? Ведь Google учитывает качество ссылок. Плюс эти рефералы увеличивают bounce rate, потому что боты фактически не проводят времени на сайте, что тоже совсем не хорошо для репутации сайта. Не уверена, что фильтр помогает избежать этих последствий.
Ответить
Алексей Тарасов
Понижают. Те, которые не распознались как робот. У Яндекса в Метрике с ними определённо проблемы, полгода прошло, и всё равно боты пролазят. Проседают поведенческие факторы (из-за отказов). Фильтр, действительно, позволяет только "закрыть глаза".
Ответить
Владимир 1377
банятся в .htaccess в таком случае
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин 17579
Не понижают, они просто имитируют визит в аналитиксе, физически на сайт никто не ссылается.
Ответить
Алексей Тарасов
Советую: https://github.com/T-igra/ItSALive

Этот небольшой код защищает статистику Яндекс Метрики (и GA) от действий рефспам-ботов.
Ответить
Ерсак Ярослав
Вообще лучше не фильтровать, а исключить такой траффик. Делается это так Администратор > Ресурс > Код отслеживания > Список исключаемых источников перехода. И там по одному добавляем.
Ответить
Владимир 1377
это исключает рефералов, но не директ
Ответить
Ерсак Ярослав
В статье идется речь о рефспаме, причем здесь директ.
Ответить
Владимир 1377
наверное потому что гости с рефспама гуляют и в представлениях директа /domination... и так далее
Ответить
Okkama
Блог о быстром старте проектов
Евгений Болтян
Создаю сегмент, но ничего не происходит. Спам все равно остается в источниках.
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин 17579
Покажите скрин, может чем помогу
Ответить
Madame Luní
А у меня не работает. Включаю проверку фильтра, и говорит, что "Этот фильтр не изменяет данные. Конфигурация фильтра неправильная или данных недостаточно". Все по скриншоту делала
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин 17579
А вы разделили на несколько фильтров строчку или все в один фильтр пытаетесь добавить?
Ответить
Sergey 22160
Подскажите, пожалуйста, у меня много фейковых заходов не с сайтов, а из гугла, то есть они отображаются в метрике как "не определенные" запросы из гугла. Соответственно, в метрике и аналитике нет никаких левых сайтов-рефералов.
Заходы происходят на несуществующие страницы типа /skachat/ Что это может быть за проблема и что с ней делать?
Ответить
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.