Реферальный спам: как от него избавиться в Google Analitics

Реферальный спам в Google Analytics: как от него избавиться?

Реферальный спам в Google Analytics испортил статистику вашего сайта? Означает ли это, что кто-то пытается взломать ваш сайт? Откуда появился этот спам? А главное, как от него избавиться?

Мы уже знаем, как избавиться от спама на своей площадке при помощи плагина WordPress. А в этой статье мы поможем вам разобраться с наиболее распространенными ошибками, которые совершаются при борьбе со спамом в Google Analytics, а также расскажем, как успешно предотвращать их впредь.

Но для начала давайте убедимся, что вы понимаете, как работает спам.

Реферальный спам в Google Analytics: каким он бывает

Реферальный спам в Google Analytics можно классифицировать по двум типам: «призраки» и «сканеры».

Призраки

Подавляющее большинство спама относится именно к этому типу. Их называют призраками, потому что они никогда напрямую не обращаются к вашему сайту. Важно иметь это в виду, поскольку так можно будет распознать источник проблемы и успешнее с ним бороться.

Как ни странно, призраки – это тот тип спама, который вообще не взаимодействует с вашим сайтом. Вы можете задаться вопросом: «Как это возможно?»,  ведь одной из главных целей Google Analytics является отслеживание посещаемости сайтов.

Ответ такой: призраки делают это с помощью специального протокола, который позволяет пользователям отправлять данные непосредственно на серверы Google Analytics. Применяя этот метод, а также, возможно, случайно генерируемые коды отслеживания, спамеры оставляют «посещение» с поддельными данными.

Сканеры

Данный тип спама, являющийся противоположностью спаму-призраку, дает прямой  доступ к вашему сайту. Как следует из названия, эти спам-боты сканируют ваши страницы, игнорируя правила, подобные тем, которые находятся в файле robots.txt – они должны мешать им просматривать ваш сайт. Когда эти спам-боты покидают ваш сайт, они оставляют в отчетности запись, похожую на законное посещение.

Сканеры сложнее определить, поскольку они преследуют конкретную цель и используют реальные данные. Если вы обнаружили в своей аналитике реферал, который выглядит подозрительно, проверьте его с помощью Google или другим удобным вам способом – это поможет определить, является ли он спамом.

 

Распространенные ошибки при работе со спамом в Google Analytics

На данный момент можно выявить три основные ошибки, которые пользователи сети совершают, пытаясь нейтрализовать реферальный спам в Google Analytics.

Ошибка №1. Блокирование спама-призрака из файла .htaccess

Одна из самых больших ошибок – это попытка блокировать «призраков» из файла .htaccess.

Для тех, кто не знаком с этим файлом: одна из его основных функций – разрешение/запрет доступа к вашему сайту. Мы знаем, что призраки никогда напрямую не взаимодействуют с сайтом – поэтому попытка создать барьер против них не будет иметь никакого эффекта, только поспособствуют появлению бесполезных строк в файле .htaccess.

Спам-привидение обычно появляется на несколько дней, а затем исчезает. В результате может показаться, что они успешно заблокированы сайтом, хотя на самом деле это просто совпадение по времени. Но когда спамеры возвращаются, большинство пользователей пугается и думает, что привычное решение проблемы больше не работает – кажется, что спамер каким-то образом обошел все барьеры.

Тем не менее, файл .htaccess эффектно борется со сканерами, такими как buttons-for-website.com и некоторыми другими, поскольку они имеют прямой доступ к вашему сайту.

Ошибка №2. Использование списка исключения рефералов для остановки спама

Другая ошибка заключается в попытке использовать список исключений рефералов, пытаясь остановить реферальный спам в Google Analytics. Несмотря на свое название, данный список не предназначен для исключения спама – он работает иначе.

Например, когда клиент совершает покупку в интернет-магазине, его иногда перенаправляют на стороннюю страницу для совершения оплаты. После внесения платежа его перебрасывает обратно на веб-сайт, и Google Analytics регистрирует это как новый реферал. Чтобы предотвратить это, целесообразно использовать список исключений для рефералов.

Но если вы попытаетесь использовать список исключений рефералов для управления спамом – часть реферала будет удалена, так как нет существующей записи. Будет зарегистрирован прямой визит, и в этом случае появится более существенная проблема, чем та, с которого вы столкнулись до этого. Вас по прежнему будет атаковать спам, так как прямые посещения сложнее отслеживать.

Ошибка №3. Беспокойство из-за того, что изменения показателя отказов повлияют на ранжирование

Когда пользователи замечают, что показатель отказов резко меняется из-за переизбытка спама, они начинают беспокоиться о влиянии, которое он способен оказать на их ранжирование в результатах поиска. Это еще одна типичная ошибка. Со спамом или без него, Google не учитывает показатели Google Analytics как фактор ранжирования.

 

Означает ли реферальный спам в Google Analytics то, что мой сайт взломан?

Есть одна достаточно распространенная проблема: когда пользователь видит странные целевые страницы из спама в своих отчетах, ему начинает казаться, что они был взломан. В этом случае страница, которую спам показывает в отчетах, не существует –  если попытаться открыть ее, появится ошибка 404. Значит, ваш сайт не был взломан.

Но вы должны убедиться, что страница действительно не существует. Потому что бывают случаи (не связанные со спамом), когда на некоторых интернет-площадках происходит нарушение безопасности – в их структуру вводятся страницы с плохими ключевыми словами с целью испортить  репутацию сайта.

О чем тогда вам следует беспокоиться? О фальшивом следе, который оставляет спам. Он может оказывать влияние на ваш сайт в зависимости от его трафика, но надо помнить, что все подвержены спаму.

Мелкие и средние сайты проще атаковать – не только потому, что существенная часть их трафика может быть спамом, но также и потому, что обычно эти сайты являются самоуправляемыми, а иногда вовсе не имеют поддержки аналитика или веб-мастера.

Крупные сайты с большим трафиком также могут быть затронуты спамом – и хоть это воздействие может быть и незначительным, недействительный трафик означает неточные отчеты независимо от размера веб-сайта.

 

Как предотвратить реферальный спам в Google Analytics? Действенные методы борьбы

К счастью, есть хороший способ предотвратить все эти проблемы. Существенная часть спама (призрака) работает, затрагивая случайные идентификаторы отслеживания Google Analytics – это означает, что преступник не знает, кто является его целью, и по этой причине либо имя хоста не установлено, либо используется поддельный. В большинстве случаев это будет домен. Но также это может быть результат применения платных услуг, услуг перевода или любой другой функции, для которой вы добавили код отслеживания Google Analytics.

Исходя из этого, мы можем создать фильтр, который будет включать только обращения, в которых используются реальные имена хостов. Это автоматически исключает все обращения из спама-призрака, независимо от того, отображается ли оно в качестве реферала, ключевого слова или просмотра страницы.

Чтобы создать данный фильтр, вам необходимо найти отчет имен хостов. Вот как это сделать:

  1. Перейдите на вкладку «Отчетность» в Google Analytics;
  2. Нажмите «Аудитория» на панели слева;
  3. Разверните «Технологии» и выберите «Сеть»;
реферальный спам в Google Analytics

как создать пользовательский фильтр в Google Analytics

4. Затем в верхней части отчета щелкните по имени хоста:

реферальный спам в Google Analytics

Как создать пользовательский фильтр в Google Analytics

После этого вы увидите список всех имен хостов, включая те, которые использует спам. Составьте список всех допустимых имен хостов, как показано в примере ниже:

vashdomen.ru

blog.vashdomen.com

 

Важно! Для маленьких и средних сайтов этот список имен хостов, скорее всего, будет состоять из основного домена и, возможно, пары поддоменов. После того как вы будете уверены, что получили каждый из них, создайте комбинацию, подобную этой:

.*vashdomen\.ru* .*blog.vashdomen\.ru*

После этого создайте пользовательский фильтр. Вот как это сделать:

  1. Нажмите вкладку Администратор на левой панели Google Analyticsреферальный спам в Google Analytics

2. Затем нажмите на «Имя хоста». На странице фильтра скопируйте свое выражение в поле Шаблон фильтра.

Перед сохранением можно проверить фильтр, чтобы убедиться, что с ним всё в порядке. Когда вы закончите, установите его для сохранения и примените фильтр.

Всего один этот фильтр избавит вас от будущих случаев атаки спама-призрака, в которых используются недопустимые имена хостов, а еще это не требует особого обслуживания.

Теперь вам остается только позаботиться о спам-роботе. Поскольку сканеры обращаются напрямую к вашему сайту, вы можете заблокировать их, добавив следующие строки в файл .htaccess:

RewriteEngine On

Options +FollowSymlinks

RewriteCond %{HTTP_REFERER} ^https?://([^.]+\.)*semalt\.com\ [NC,OR]

RewriteRule .* – [F]

В данном случае в итоге будут заблокированы все заходы с доменов и поддоменов «semalt.com». Вставьте вместо него домены рефералов, которые мешают именно вам.

Как остановить реферальный спам в Google Analytics этим способом?

Важно отметить, что этот файл очень чувствителен, поэтому перед редактированием создайте резервную копию файла .htaccess.

  1. Зайдите на FTP через Filezilla и скачайте файл .htaccess:
  2. Затем откройте файл при помощи программы Notepad ++ и добавьте код, указанный выше:

3. Теперь просто сохраните обновленный файл на FTP.

 

Вот и всё! Благодаря всем этим нехитрым действиям вы сможете меньше беспокоиться о том, что спам может заражать ваши данные. Еще одно дополнительное преимущество – у вас появится больше свободного времени, которое вы можете потратить на фактический анализ ваших данных.

Возможно вам это тоже будет интересно: