¿Cómo eliminar el SPAM de referencia en Google Analytics?

Por el 22/12/2016 a las 17:50

El spam de referencia o referrer spam se trata de las visitas que llegan a nuestro site desde un determinado dominio a través de un enlace que apunta a nuestra web, y que realmente no son visitas reales. Tienen un comportamiento extraño como puede ser una duración de 0 segundos.

¿Desconoces si tu site tiene referrer spam?

Es fácil de comprobarlo, tan sólo tienes que ir dentro de analytics y seleccionar “Adquisición -> Todo el tráfico -> Referencias

referral-spam1

En este caso, en rojo hemos marcado las dos fuentes que tienen una duración de 0, luego podemos considerarlas como SPAM.

Sin embargo tenemos otras dos fuentes remarcadas en naranja, tenemos dudas de si pueden ser SPAM o no. Por el dominio diríamos que si, pero no estamos seguros ya que aunque el tiempo medio de la sesión no llega al minuto, no sabemos si declararlo como SPAM.

Además, también hemos visto que tenemos una fuente cuya duración media de sesión resalta bastante.

¿Cómo puedo estar seguro de que estas fuentes sean SPAM?

Pues bien, para ello podemos buscar información sobre estos dominios en google  o también mirar en la lista de Piwik sobre el referrer spam.

En este caso, las 5 fuentes se encuentran en la blacklist por lo que todas son SPAM. Estas “visitas” lo que hacen es distorsionar los datos del tráfico de nuestro site.

¿Cómo quitamos estas visitas de analytics?

Lo que haremos será crear en analytics un filtro de exclusión que incluya estos host de referencia, para evitar que las tenga en cuenta. No podremos evitar que sigan produciéndose, pero eso no se verá reflejado dentro de analytics.

Para ello vamos a “Administrador -> Filtros

referral-spam2

Crearemos un filtro de exclusión de la siguiente manera:

referral-spam3

En el patrón del filtro, usaremos una expresión regular que incluya todas las fuentes de tráfico que hemos visto anteriormente.

Al tratarse de expresiones regulares, hemos de ir con cuidado, porque un simple espacio puede hacer que no funcione. Para ello, podemos consultar la siguiente información por parte de Google sobre la configuración de las expresiones regulares.

De esta manera evitaremos que se filtre dentro de nuestros datos información sobre las visitas de estos sites.

Eso sí, asegúrate que realmente son SPAM antes de añadir un filtro de exclusión de este tipo xD