Limitaciones de la información demográfica y de intereses en Google Analytics

Desde su puesta en marcha, la información demográfica y de intereses en Google Analytics despierta interés por el valor agregado que proporciona para el análisis de comportamiento de los usuarios, así como cierto nivel de misterio acerca de su origen y aplicación real.

Quienes han profundizado en los respectivos reportes, habrán notado que la información que éstos proporcionan considera sólo una parte de los usuarios que han visitado el sitio. Dicha parte considerada se puede inferir que corresponde a aquellos usuarios visitantes, los usuarios de Google, generalmente del servicio GMAIL, y que tienen una sesión iniciada en el dispositivo o navegador.

Este segmento de usuarios corresponde a una muestra del total, la que sin embargo, no tiene consideraciones estadísticas conocidas. De hecho, si se trata realmente de todos los usuarios que se pueden reconocer por su cuenta Google, es difícil sostener con certeza que se trata de una muestra representativa del universo total. Luego, cabe preguntarse, si realmente existen condiciones para obtener una muestra representativa a partir de datos de Google Analytics. Probablemente la respuesta sea negativa si el volumen de visitantes no alcanza cierto nivel. Esta falta de rigor estadístico puede generar dudas sobre la precisión de la información obtenida, tanto en métricas generales como en segmentos y aperturas generadas a partir de estos datos.

Cuando se utiliza este tipo de información en Google Analytics existen asimismo ciertos umbrales o límites, que pueden excluir aún más usuarios de la muestra final. Al aplicar estos umbrales garantizamos que cualquier dato que represente a un grupo acotado de usuarios,  puede quedar fuera de la información finalmente reportada.

El siguiente ejemplo muestra cómo un cruce en un reporte de páginas, con el dato “Edad” como dimensión secundaria, verifica datos para los pares página-edad cuyas páginas vistas únicas es igual a 10 en el periodo.

Como podemos ver en el mismo reporte, si el filtro se restringe a 9 páginas vistas únicas, el resultado es que no se reporta información:Esta restricción parece verificarse en todo reporte de tabla al cuál se aplique segmentación por dato demográfico, sea a través de dimensión secundaria o por segmentos avanzados. Asimismo, el número clave parece ser 10 usuarios. Cualquier conjunto de datos que considera menos de 10 usuarios, será descartado de la información resultante, independientemente del período consultado.

En el caso de los reportes de comercio electrónico, dado que una transacción está intrínsecamente relacionada con un usuario específico, el cruce del reporte de Id de transacciones y segmentos demográficos nunca reportará información. En reportes de producto, se aplica la restricción de 10 ventas únicas (en definitiva, usuarios) para el e-commerce tradicional, no se muestra en ningún caso información en la versión enhanced e-commerce.

Con estas limitaciones en conocimiento, el siguiente razonamiento muestra en qué contexto los datos demográficos y de intereses proporcionan información agregada al comportamiento de usuarios en un nivel aceptable. En términos generales, a mayor volumen de usuarios que visita el sitio, mejorará la calidad de la muestra de usuarios de Google. Al utilizar estos datos como dimensión secundaria o segmentos avanzados, debemos identificar los conjuntos que tienen menos de 10 usuarios, sean éstos páginas, eventos, campañas, y cualquier dimensión o segmento, y descartar cualquier análisis demográfico o de intereses con ellos.

Finalmente, para un sitio con un nivel relativamente bajo de visitantes, por lo expuesto anteriormente, la información demográfica y de intereses pierde precisión, lo que puede subsanarse en parte considerando periodos de consulta más amplios y sólo para analizar conjuntos mayores a 10 usuarios.

Leave Comment

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.