Web Mining: ¿Por qué ahora?

cerebro

Ahora las empresas están preparadas

Cuando desde Metriplica comenzamos a charlar sobre e-metrics, allá por el 2003, Google Analytics no existía (vino al mundo en el 2005) y eran muy pocas las empresas que se planteaban la medición online en serio. Ni que decir tiene que, hacer Web Mining sonaba a poco menos que a ciencia ficción, aunque nosotros ya eramos unos fanáticos. Hoy en día, prácticamente todas las e-empresas tienen, como mínimo, Google Analytics instalado, por lo que ya miden aquellas interacciones que sus visitantes hacen con el site, pero no utilizan esa información para predecir comportamientos futuros. Parece tener suficiente con usar esos datos para resolver problemas del presente. Dado el nivel de madurez actual, desde Metriplica estamos convencidos que ese ha de ser el siguiente paso. De hecho, para nosotros, ya lo es: creemos plenamente en el triunvirato formado por la analítica web, la inteligencia de negocios y la inferencia estadística.

La web inteligente: ¿cómo?

¿No nos gustaría que, nada más entrar en un site, se nos presente aquel contenido que nos disponíamos a buscar? Se trata, ni más ni menos, de contenidos personalizados. Pero, ¿cómo sabe el site quién soy y qué quiero, si ésta es mi primera entrada? Evidentemente, el site no lo sabía: ¡lo ha aprendido! La respuesta nos la ofrece la Minería de Datos (Data Mining), y de forma más concreta, el Web Mining. Detrás de estas dos palabras se esconde toda una rama de las matemáticas y de la algorítmica con una red de complicados conceptos y todavía más complicados algoritmos.

El Data Mining nos permite, a partir de una muestra (la interacción de los visitantes previos), extraer e inferir información sobre el resto de la población (tanto usuarios nuevos como recurrentes). Por ejemplo, y para citar dos análisis clásicos de la minería de datos, el análisis del carrito de supermercado (Market Basket Analysis) nos permite optimizar nuestras cross-sales, nuestras up-sells, el clickthorugh, etc. Otro ejemplo es el clustering de usuarios a partir de sus características (que previamente habremos de definir, y que no siempre es un puno fácil). Todas estas técnicas nos permiten enviar publicidad a medida (aquella que tiene la mayor probabilidad de conversión) y mostrar contenido a un usuario que pertenezca a un cierto cluster, a pesar de que ésta sea su primera visita.

Los actores

Es importante tener claro que los estadísticos descriptivos, aquellos proporcionados por la mayoría de softwares de Analítica Web, no dan información sobre los visitantes futuros, salvo algunas excepciones como la opción Intelligence de Google Analytics. Es necesario, pues, recoger y procesar estadísticos más allá de las métricas y KPIs habituales. Y aquí nos encontramos con las grandes custiones:

¿Qué datos recogo?

La primera pregunta tiene una respuesta clásica: depende. Depende de aquella inquietud que deseemos resolver: para la publicidad a medida tendremos que recoger datos referentes a las campañas previas así como sus respuestas, para el Análisis del carrito del supermercado tendremos que recoger datos transaccionales, etc.

¿Cómo los registro?

La segunda es un tanto más delicada, y merece unas cuantas horas de discusión que incluyen métricas, tecnología y hosting. Es una pregunta que tendremos que resolver con nuestros compañeros de sistemas.

¿Cómo los presento e integro?

La tercera pregunta es la más apasionante de todas, ya que su respuesta nos lleva a un mundo nuevo. Pero sólo es nuevo desde la perspectiva de la analítica web, porque desde la perspectiva del márketing tradicional se trata de un viejo conocido: Business Intelligence. Existen multitud de herramientas que nos permiten una flexibilización ilimitada sobre los reportes. Algunas son de pago y otras son gratuitas. La respuesta puede pasar por Oracle, SQL Server, SAP, Pentaho y tantos otros. La principal característica a la que tendremos que prestar especial atención es a la facilidad que ofrezca el integrador de datos. Si necesitamos datos transaccionales tendremos que cruzar éstos con los que nos de Google Analytics y con otras fuentes. Cuantos más cruces, más ajustadas serán las características y más realistas serán los clusters, pero a la vez tendremos más dificultad de cálculo y más dificultad de conseguir la significancia estadística deseada. Tenemos pues, una negociación entre cantidad de tráfico y realismo de resultados.

¿Cómo los proceso?

La cuarta pregunta es, quizás, la más fácil de contestar; tenemos actualmente una gran cantidad de software estadístico especializado: SPSS, Clementine, R, Rapid Miner, etc. Algunos son gratuitos, otros un poco más caros y otros mucho más caros. Un estadístico o un matemático te dará la respuesta que más se adapte a tus necesidades.

Si piensas que todo esto te queda un poco lejos, ¡no tienes más que contactarnos!

Autor:

Fundador de Metriplica y socio de la consultora Multiplica Licenciado en Ciencias y técnicas estadísticas. Programador Mainframe Profesor de Masters y Postgrados en diversas universidades y escuelas de negocio.

5 Comments

  1. Vaya ¡Dr. Intelligence! con ese nombre me quitaras el cargo de super villano (Dr. No). En hora buena por el post.

    Andrés

  2. admin

    Jejeej, un día de estos nos llamará la Marvel reclamando derechos de autor…
    Un saludo.

  3. buen, blog, no falta nada. Viniendo desde la analítica off line, tengo la sensación de que el próximo hito de analítica web será la integración con el resto de data de una compañía. Sabes qué opciones, tecnología, hay para efectivamente trabajar en entornos business intelligence on-off line?

    De otra manera, es posible con Google Analytics acceder a logs brutos con sus metadatos, para integrarlos con otra data? ¿O con otro soft?

    Como me temo que la respuesta no será de dos líneas, podéis tomarlo como sugerencia para futuros posts.

    Enhorabuena por el blog, muy interesante,

  4. Bleue

    Genial el post, la integración es el futuro y uno de los retos más grandes. Que vengan más sobre este tema! gracias.

Leave Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.