Los clientes de Google Analytics 360 (antes Premium) pueden acceder a sus datos crudos, asociando una vista de Google Analytics a un proyecto de BigQuery.

Hoy retomaremos el tema de las conexiones, en concreto con BigQuery, un almacén de datos que la plataforma Google Cloud pone a nuestra disposición para realizar consultas SQL de manera rápida, eficaz y con un coste reducido.

Anteriormente hemos comentado el potencial de la herramienta de análisis estadístico R (véase Cómo empezar a usar R Statistics, Visualización de datos de Google Analytics con R o Una conexión de titanes: Google Analytics y R Statistics).

Actualmente BigQuery usa por defecto su lenguaje propio, Legacy SQL, aunque con el lanzamiento de BigQuery 2.0 se recomienda la migración a Standard SQL.

Podemos ver más en detalle cómo plantear una consulta en BigQuery.

A continuación se detallan los pasos a seguir para realizar una consulta en BigQuery desde R:

1. Accediendo a BigQuery.

Para acceder a la interfaz de BigQuery, iniciamos sesión con nuestra cuenta Google.

En este caso práctico queremos establecer una conexión desde R con el dataset ‘LondonCycleHelmet’, perteneciente al proyecto ‘google.com:analytics-bigquery’. En él encontramos la tabla ‘ga_sessions_20130910’, con los datos de navegación de una web ficticia en dicha fecha.

Al no tener permisos de edición en este proyecto, haremos una copia de dicha tabla para almacenarla en ‘My Project’, sobre el que sí tenemos permisos. En él creamos un nuevo dataset llamado ‘bigrquery’, del que colgará la tabla ‘ga_sessions_20130910_copy’.

BigQuery

La notación para hacer referencia a una tabla es la que sigue:

proyecto:dataset.tabla
Google BigQuery

Para saber el nombre del proyecto pasaremos el cursor sobre ‘My Project’:

Google BigQuery

2. Iniciando R.

Iniciamos sesión en R y ejecutamos el siguiente código, asignando los valores que corresponda:

Google BigQuery

3. En la consola de R nos aparecerá el siguiente mensaje:
R BigQuery

Al seleccionar la opción 1 y permitir el acceso a la actual cuenta de Google, se creará un archivo ‘.httr-oauth’ en el directorio de trabajo de R, en el que se almacenan las credenciales entre sesiones de R.

4. Con el paso anterior se realiza la conexión entre R y BigQuery, almacenando el resultado de la consulta en el data.frame ‘datos’:
R Studio

En este ejemplo nuestra consulta es simple y calcula valores agregados. El verdadero potencial de esta conexión reside en importar los datos de navegación y luego trabajar con ellos en R.

Keep trying and enjoy R!!!

Conectando BigQuery y R Statistics

Leave Comment

Your email address will not be published. Required fields are marked *