Combattre les spams sur Google Analytics

Comment combattre les spams sur Google Analytics ?

Dernière mise à jour : le 19/12/18

Note importante : Cet article est mis à jour à chaque découverte d’un nouveau robot. Si vous souhaitez être au courant en temps réel des nouveaux spams, inscrivez votre mail dans ce formulaire.(vous recevrez un mail par mois en moyenne.)

Connaître les statistiques de votre site web est un enjeu essentiel pour pouvoir prendre des décisions stratégiques quant à votre activité. Plugger Google Analytics à votre site est un jeu d’enfant. La plupart des gestionnaires de site effectuent cette manipulation et se contentent dans un premier temps de regarder les kpi essentiels : sessions, taux de rebond, nombre d’utilisateurs etc. On peut (il faut) bien sûr aller beaucoup plus loin

Avant toute chose, il faut savoir que la plupart du temps ces données sont faussées à cause des spams. Il est indispensable de faire une première configuration de votre compte Google Analytics avant de tenter une quelconque analyse de vos statistiques. Nous verrons d’une part dans cet article comment éradiquer les robots spammeurs (spams crawlers) qui visitent un site sans aucun interêt  et d’autre part nous verrons comment bloquer les robots fantômes (spams ghosts), qui polluent directement les analytics. 

Stopper les spams crawlers

Qu’est ce qu’un spam referer ?

Contrairement aux spam fantômes que nous verrons après, ce type de spam visite réellement votre site. Ils ne tiennent pas compte du tout de ce que vous avez configuré dans votre robots.txt et explorent vos pages en vous laissant des visites qui apparaissent comme légitimes. Il sont ainsi beaucoup plus difficiles à identifier. 

Comment voir si votre site est spammé ?

Connectez vous à votre compte GA. Rendez vous dans la rubrique acquisition > tout le trafic > sites référents

Regardez ce qui apparait (revenez quelques mois en arrière). En général, ces spammeurs montrent parfois beaucoup de visites avec à chaque fois 1 page visitée, un taux de rebond à 100% etc.

Voici un exemple :

Identifier les spams referer dans Google Analytics

Nous avons ici une 60aine de visites comptabilisées mais non pertinentes.

Comment stopper les spam referer ?

Nous allons pour cela créer des filtres d’exclusion dans la partie “administration” de votre compte Google Analytics. Nous en sommes aujourd’hui à 3 séries de filtres à exclure. En effet pour éviter de surcharger les filtres, on les sépare. Lorsque la série du spam 3 sera trop chargée on commencera une série de spam 4 et ainsi de suite (Une fois par an, les spams qui n’existent plus sont supprimés de ces filtres, nous sommes bons pour 2019 🙂 ). Pas de panique vous allez comprendre.

Créez une filtre nommé : Spam 1 (vous le ferez pour chaque groupe de spams de la même manière, seules les expressions à exclure changent d’un filtre à l’autre.

Type : personnalisé

Exclure -> champ de filtrage -> source de la campagne

Coller les expressions  correspondantes ci-dessous.

Configurer les filtresanti spam referer sur Google Analytics

Spam 1 :

Spam 2 :

Spam 3 :

Stopper les spams fantômes

Qu’est ce qu’un ghost spam ?

Il faut savoir que ce type de spam est le plus répandu dans Google Analytics. Ils ne visitent pas directement votre site mais passent par le protocole de mesure qui lui va faire remonter des datas sur votre compte. On suppose qu’ils spamment de façon aléatoire des codes de suivi (type UA-xxxxx-1) et cela tombe parfois sur vous. Si vous voulez jeter un oeil au protocole de mesure Google Analytics.

La première question qu’il faut vous poser est : Est-ce que mon site a déjà été spammé ? Comment le vérifier ?

Suivez les étapes de l’exemple ci-dessous et aller vérifier quel nom d’hôte communique avec votre site. En aucun cas il ne doit y avoir de nom de domaine différent du votre. Peu importe que ce soit un domaine d’autorité ou non (type google.com, facebook.com, orange.fr etc). Seul votre nom de domaine doit envoyer des infos à votre GA (normal non ?)

Revenez à plusieurs semaines ou mois en amont dans vos plages de dates (exemple entre le 1er janvier 2017 et ce jour) puis allez dans : audience (1) > technologie (2) > réseau (3) > dans la dimension principale choisissez “nom d’hôte”

combattre les ghosts spams sur Google Analytics

Voici un exemple de compte spammé par des fantômes. On peut constater qu’il n’y a qu’une page visitée, un taux de rebond à 100%, pas de durée de session et bien entendu aucun objectif. Tout ceci se rajoute aux statistiques de vos vraies visites. Ces dernières étant faussées, l’analyse de vos kpi le sera aussi !

exemple de compte google analytics spammé par des ghosts spam

Comment bloquer les ghosts spams ?

Pour stopper tout ces fausses visites, il va falloir appliquer un filtre.  Il est bien entendu complètement inutile d’utiliser le fichier .htaccess pour bloquer ce type de spam puisque souvenez vous, ces derniers ne visitent pas votre site.

Nous allons nous rendre dans notre vue “master” et suivre ces étapes :

Créez une filtre nommé : Nom d’hôte

Type : personnalisé

Inclure -> champ de filtrage ->nom d’hôte

ajouter un filtre anti spam dans Google Analytics

filtre ghost spam nom d'hôte Google Analyticsajouter un filtre anti spam dans Google Analytics

Regardez d’ici quelques jours, vos spammeurs auront disparu !

Si toutes ces manipulations vous font peur, n’oubliez pas que nous sommes là pour configurer et optimiser vos comptes Google Analytics.