Лучшие статьи и кейсы стартапов
Включить уведомления
Дадим сигнал, когда появится
что-то суперстоящее.
Спасибо, не надо
Вопросы Проекты Вакансии
Cервис мониторинга Google AdWords Quality Score
Рекомендуем
Продвинуть свой проект
Лучшие проекты за неделю
26
Битрикс24

Битрикс24

www.bitrix24.ru

16
Отследить-посылку

Отследить-посылку

B2B-сервис трекинга посылок

14
myPreza

myPreza

mypreza.ru

13
WebResidentTeam

WebResidentTeam

webresident.agency

12
Perezvoni.com

Perezvoni.com

perezvoni.com

11
Expresso

Expresso

www.expresso.today

10
YAGLA

YAGLA

yagla.ru

10
Reader

Reader

Интернет-журнал о современных технологиях.

Показать следующие
Рейтинг проектов
Подписывайтесь на Спарк во ВКонтакте

Побеждаем реферальный спам в Google Analytics

8 741 33 В избранное Сохранено
Авторизуйтесь
Вход с паролем
В последнее время проекты, у которых не так уж много источников трафика наблюдают в Google Analytics кучу непонятных переходов, которые портят статистику и мешают нормальной работе. Давайте избавимся от них раз и навсегда!

В последнее время подобная картина знакома многим (особенно мелким компаниям, у которых в Google Analytics не так уж и много источников трафика):

b_5541e2a3b2de6.jpg

Предприимчивые дельцы генерируют фейковые переходы на сайт и оставляют свой рефферер перехода или источник кампании, в надежде на то, что владелец аккаунта GA обратит на ссылку внимание и решит по ней перейти.

Перейдя по такой ссылке, человека будет ждать какой ни будь сайт, участвующий в одной из CPA сетей (например aliexpress). Разумеется, человек такой сайт закроет, однако, кука посещения у него останется. Весь расчет идет на то, чтобы "заразить" такими куками как можно больше людей и чтобы какая-то часть из посетителей совершила (сразу или в течение 30 дней) целевое действие на этом сайте.

Поскольку, покупать ничего на aliexpress мы не хотим, нужно как-то избавляться от этих ссылок, захламляющих наши отчеты в GA. Ниже несколько способов избавления от спама Google Analytics.

Исключаем источники

С помощью фильтра (не изменяет исторические данные)

Для того, чтобы исключить все ненужные нам источники — создадим новое представление (view), к которому мы применим наш фильтр (показанный на скриншоте):

b_5541e8fba723d.jpg

Последний шаблон фильтра (собраны самые достающие источники) —

darodar\.|semalt\.|buttons-for-website|blackhatworth|ilovevitaly|prodvigator|cenokos\.|free-share-buttons\.|buy-cheap-online\.|googlsucks\.|theguardlan\.|youporn-forum\.|get-free-traffic-now\.|ranksonic\.|adcash\.|simple-share-buttons\.|social-buttons\.|hulfingtonpost\.|best-seo-solution\.|buttons-for-your-website\.
Не забывайте проверять свой фильтр, чтобы не исключить ничего лишнего.
upd: в шаблон фильтра влезает только 255 символов (поэтому проверка может выдавать ошибку), рекомендую разбить строчку на 2 фильтра или же пользоваться расширенным сегментом.

С помощью сегмента (изменяет исторические данные)

Создаем расширенный сегмент с такими настройками:

b_5541eac8290bd.jpg

Исключаем в источнике/канале точно такие же источники —
darodar\.|semalt\.|buttons-for-website|blackhatworth|ilovevitaly|prodvigator|cenokos\.|free-share-buttons\.|buy-cheap-online\.|googlsucks\.|theguardlan\.|youporn-forum\.|get-free-traffic-now\.|ranksonic\.|adcash\.|simple-share-buttons\.|social-buttons\.|hulfingtonpost\.|best-seo-solution\.|buttons-for-your-website\.

После применения такого сегмента можно наблюдать существенную разницу в отчетах:

До

b_5541ec99e2cbf.jpg

После

b_5541ec57a1206.jpg

Результат налицо. Надеюсь, эта статья будет полезна небольшим компаниям (стартапам), которые каждый день сталкиваются с этой проблемой.

Если вы знаете еще какие нибудь более удобные и автоматические способы — просьба делиться в комментариях.

+17
Добавить в избранное Сохранено
Авторизуйтесь
Вход с паролем
Первые Новые Популярные
artweb
Студия больших амбиций
Владимир
Это наблюдается только на вордпресс проектах, у которых подключены плагины. Когда недавно запустил такой, уже решил эту проблему. По-поводу вашего шаблона фильтра "По меньшей мере одно поле содержит недействительные данные. Исправьте их и отправьте форму еще раз."
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин
У нас несколько сайтов не на WP и похожая картина наблюдается. По поводу ошибки, прошу прощения, забыл написать, что в шаблон влезает 255 символов, нужно в 2 фильтра делать.
Ответить
artweb
Студия больших амбиций
Владимир
странно, у меня 2 проекта на yii своя кмс, 1 на джумле и 2 на вп все на одном хостинге и такое только на ВП где есть плагины, на пустом — нету
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин
А домены на других кмс — старые? У меня есть мнение, что спамят только новые домены, где трафика почти нет и такие переходы гораздо заметнее.
Ответить
artweb
Студия больших амбиций
Владимир
да, кстати, может тогда стоит предъявлять претензии регистратору? Хотя, непонятный момент, в счетчиках яда их нету.
Ответить
Okkama
Блог о быстром старте проектов
Евгений Болтян
У моего клиента таких туча появилась именно на лендинге. Чистом html лендинге.
Ответить
Igor SnooPeR
Владимир, у меня точно эти же reffers url на друпале тестовом с первого дня запуска
Ответить
eden lane
Tumblr блог, те же источники
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин
Скорее всего парсится база новых доменов и спам идет по ним.
Ответить
Galagram
Интернет проект о китайских гаджетах
Дмитрий Лупич
Рефф спам — это атака не на сайт, а на Google Analtics и Yandex Метрику.

Спемер даже на заходит на сайт, его паук имитирует посещения в самой аналитике. Хоть миллион "уников" реф спама зайдет на сайт — нагрузка на сервер не будет, разве что на сервер Google/Yandex.

P.S. метод не исключает реф спам, а лишь скрывает его в Аналитике, но за статью спасибо
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
А это моя строка для сайта в зоне com:
social-buttons.com|buttons-for-your-website.com|4webmasters.org|googlsucks.com|theguardlan.com|best-seo-offer.com|free-share-buttons.com|sexyteens.hol.es|buy-cheap-online.info|www.Get-Free-Traffic-Now.com|best-seo-solution.com|searches.uninstallmaster.com
Ответить
Показать предыдущие комментарии
adStein
Cервис мониторинга Google AdWords Quality Score
Константин
По хорошему, точки экранировать надо)
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Это загадка но с экранами не работало
Ответить
artweb
Студия больших амбиций
Владимир
Оно скорей не работает, чем работает. А не работало из-за ограничения по количеству символов в поле, поправку в статье уже сделали по этому поводу.
Ответить
Симулятор бизнес-процессов
Сервис имитационного моделирования и оптимизации бизнес-процессов
Prolis Labkk
Спасибо поправил у себя. А почему точка а не звезда?
Ответить
artweb
Студия больших амбиций
Владимир
точка один символ, звезда — все
Ответить
Boosta.ru
Сайт об интернет-маркетинге: кейсы, советы, анализ ошибок, обзор сервисов
Andrei
Пытался сделать, как у вас тут описано. но ничего не получилось, к сожалению(
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин
Какую ошибку выдает?
Ответить
Native Connections
Маркетинговые материалы на английском
Хищенко Елена
А эти левые рефералы не понижают рейтинг сайта? Ведь Google учитывает качество ссылок. Плюс эти рефералы увеличивают bounce rate, потому что боты фактически не проводят времени на сайте, что тоже совсем не хорошо для репутации сайта. Не уверена, что фильтр помогает избежать этих последствий.
Ответить
Whaler
Рекламные объявления для платящей аудитории
Алексей Тарасов
Понижают. Те, которые не распознались как робот. У Яндекса в Метрике с ними определённо проблемы, полгода прошло, и всё равно боты пролазят. Проседают поведенческие факторы (из-за отказов). Фильтр, действительно, позволяет только "закрыть глаза".
Ответить
artweb
Студия больших амбиций
Владимир
банятся в .htaccess в таком случае
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин
Не понижают, они просто имитируют визит в аналитиксе, физически на сайт никто не ссылается.
Ответить
Whaler
Рекламные объявления для платящей аудитории
Алексей Тарасов
Советую: https://github.com/T-igra/ItSALive

Этот небольшой код защищает статистику Яндекс Метрики (и GA) от действий рефспам-ботов.
Ответить
Ерсак Ярослав
Вообще лучше не фильтровать, а исключить такой траффик. Делается это так Администратор > Ресурс > Код отслеживания > Список исключаемых источников перехода. И там по одному добавляем.
Ответить
artweb
Студия больших амбиций
Владимир
это исключает рефералов, но не директ
Ответить
Ерсак Ярослав
В статье идется речь о рефспаме, причем здесь директ.
Ответить
artweb
Студия больших амбиций
Владимир
наверное потому что гости с рефспама гуляют и в представлениях директа /domination... и так далее
Ответить
Okkama
Блог о быстром старте проектов
Евгений Болтян
Создаю сегмент, но ничего не происходит. Спам все равно остается в источниках.
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин
Покажите скрин, может чем помогу
Ответить
Madame Luní
А у меня не работает. Включаю проверку фильтра, и говорит, что "Этот фильтр не изменяет данные. Конфигурация фильтра неправильная или данных недостаточно". Все по скриншоту делала
Ответить
adStein
Cервис мониторинга Google AdWords Quality Score
Константин
А вы разделили на несколько фильтров строчку или все в один фильтр пытаетесь добавить?
Ответить
Sergey
Подскажите, пожалуйста, у меня много фейковых заходов не с сайтов, а из гугла, то есть они отображаются в метрике как "не определенные" запросы из гугла. Соответственно, в метрике и аналитике нет никаких левых сайтов-рефералов.
Заходы происходят на несуществующие страницы типа /skachat/ Что это может быть за проблема и что с ней делать?
Ответить
Выбрать файл
Читайте далее
Загружаем…
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать