Spam sur Google Analytics

Combattre les spams sur Google Analytics

20 décembre 2018

Analytics

Article mis à jour : juillet 2021

Connaître les statistiques de votre site web est un enjeu essentiel pour pouvoir prendre des décisions stratégiques quant à votre activité. Plugger Google Analytics à votre site est un jeu d’enfant. La plupart des gestionnaires de site effectuent cette manipulation et se contentent dans un premier temps de regarder les kpi essentiels : sessions, taux de rebond, nombre d’utilisateurs etc. On peut (il faut) bien sûr aller beaucoup plus loin

Avant toute chose, il faut savoir que la plupart du temps ces données sont faussées à cause des spams. Il est indispensable de faire une première configuration de votre compte Google Analytics avant de tenter une quelconque analyse de vos statistiques. Il existe bien sur des alternatives à Google Analytics. Nous verrons d’une part dans cet article comment éradiquer les robots spammeurs (spams crawlers) qui visitent un site sans aucun interêt  et d’autre part nous verrons comment bloquer les robots fantômes (spams ghosts), qui polluent directement les analytics. 

Stopper les spams crawlers

Qu’est ce qu’un spam referer ?

Contrairement aux spam fantômes que nous verrons après, ce type de spam visite réellement votre site. Ils ne tiennent pas compte du tout de ce que vous avez configuré dans votre robots.txt et explorent vos pages en vous laissant des visites qui apparaissent comme légitimes. Il sont ainsi beaucoup plus difficiles à identifier.

Identifier les spams referer dans Google Analytics

Comment voir si votre site est spammé ?

Connectez vous à votre compte GA. Rendez vous dans la rubrique acquisition > tout le trafic > sites référents

Regardez ce qui apparait (revenez quelques mois en arrière). En général, ces spammeurs montrent parfois beaucoup de visites avec à chaque fois 1 page visitée, un taux de rebond à 100% etc.

Voici un exemple :

Spam referer Google Analytics

Nous avons ici une 60aine de visites comptabilisées mais non pertinentes.


Comment stopper les spam referer ?

Nous allons pour cela créer des filtres d’exclusion dans la partie “administration” de votre compte Google Analytics. Nous en sommes aujourd’hui à 3 séries de filtres à exclure. En effet pour éviter de surcharger les filtres, on les sépare. Lorsque la série du spam 3 sera trop chargée on commencera une série de spam 4 et ainsi de suite (Une fois par an, les spams qui n’existent plus sont supprimés de ces filtres, nous sommes bons pour 2019 🙂 ). Pas de panique vous allez comprendre.

Créez une filtre nommé : Spam 1 (vous le ferez pour chaque groupe de spams de la même manière, seules les expressions à exclure changent d’un filtre à l’autre.

Type : personnalisé

Exclure -> champ de filtrage -> source de la campagne


Filtre anti-spam referer Google Analytics

Coller les expressions  correspondantes ci-dessous.

Spam 1 : (trafic|bot|site Web)-?(bot|trafic|site Web|4gratuit)

Spam 2 : (axcus|dotmass|artstart|dorothea|artpress|matpre|ameblo|freeseo|jimto|seo-tips|hazblog|overblog|squarespace|ronaldblog|c\.g456|zz\.glgoo|harriett|webedu|barbarahome|verabauer|deirdre |ninacecillia|reginanahum|deniseconnie|firstblog|maxinesamson)\.top

Accompagnement digital et audit

Besoin d’accompagnement ?

Nous vous proposons un audit complet (éditorial, technique et ergonomique) de votre solution digitale.

Accompagnement digital et audit

Besoin d’accompagnement ?

Nous vous proposons un audit complet (éditorial, technique et ergonomique) de votre solution digitale.

Accompagnement digital et audit

Besoin d’accompagnement ?

Nous vous proposons un audit complet (éditorial, technique et ergonomique) de votre solution digitale.

Stopper les spams fantômes

Qu’est ce qu’un ghost spam ?

Il faut savoir que ce type de spam est le plus répandu dans Google Analytics. Ils ne visitent pas directement votre site mais passent par le protocole de mesure qui lui va faire remonter des datas sur votre compte. On suppose qu’ils spamment de façon aléatoire des codes de suivi (type UA-xxxxx-1) et cela tombe parfois sur vous. Si vous voulez jeter un oeil au protocole de mesure Google Analytics.

La première question qu’il faut vous poser est : Est-ce que mon site a déjà été spammé ? Comment le vérifier ?

Suivez les étapes de l’exemple ci-dessous et aller vérifier quel nom d’hôte communique avec votre site. En aucun cas il ne doit y avoir de nom de domaine différent du votre. Peu importe que ce soit un domaine d’autorité ou non (type google.com, facebook.com, orange.fr etc). Seul votre nom de domaine doit envoyer des infos à votre GA (normal non ?)

Revenez à plusieurs semaines ou mois en amont dans vos plages de dates (exemple entre le 1er janvier 2017 et ce jour) puis allez dans : audience (1) > technologie (2) > réseau (3) > dans la dimension principale choisissez “nom d’hôte”

Combattre les spams ghosts Google Analytics


Voici un exemple de compte spammé par des fantômes. On peut constater qu’il n’y a qu’une page visitée, un taux de rebond à 100%, pas de durée de session et bien entendu aucun objectif. Tout ceci se rajoute aux statistiques de vos vraies visites. Ces dernières étant faussées, l’analyse de vos kpi le sera aussi !

Compte Google Analytics spammé


Comment bloquer les ghosts spams ?

Pour stopper tout ces fausses visites, il va falloir appliquer un filtre.  Il est bien entendu complètement inutile d’utiliser le fichier .htaccess pour bloquer ce type de spam puisque souvenez vous, ces derniers ne visitent pas votre site.

Nous allons nous rendre dans notre vue “master” et suivre ces étapes :

Créez une filtre nommé : Nom d’hôte

Type : personnalisé

Inclure -> champ de filtrage ->nom d’hôte

Ajout filtreFiltre nom d'hôte Google AnalyticsAjout filtre GA


Regardez d’ici quelques jours, vos spammeurs auront disparu !

Si toutes ces manipulations vous font peur, n’oubliez pas que nous sommes là pour configurer et optimiser vos comptes Google Analytics.

On ne mord pas !

On ne mord pas !

On ne mord pas !