Cómo conectar Google Sheets con BigQuery

Índice de contenidos

Google Sheets nos ofrece la posibilidad de conectar sus hojas de cálculo con BigQuery, para analizar, visualizar y compartir datos, mediante las Hojas conectadas.

BigQuery, uno de los productos ofrecidos por el Cloud de Google, es un almacén de datos que hace uso del lenguaje SQL como herramienta de consulta. 

Entre sus funcionalidades más avanzadas, encontramos la de crear modelos de aprendizaje automático con BigQuery ML, cuya introducción hicimos en este post hace unos meses. 

También nos da la opción de analizar datos de las nubes de Amazon AWS y Microsoft Azure con la herramienta multi-cloud BigQuery Omni.

Pero en ocasiones a nuestro cliente le interesa un nivel de explotación más básico y poder disponer del dato almacenado en BigQuery sin conocimiento del citado lenguaje de consulta estructurado, SQL. Es aquí donde entra en escena la figura de hojas conectadas de Google Sheets.

Pasos para conectar Google Sheets con BigQuery

Antes que nada hemos de asegurarnos de cumplir los requisitos de acceso a BigQuery desde Google Sheets, especificados en la documentación.

Paso 1. Conectando hoja de cálculo con la tabla de BigQuery

Configuramos la conexión de nuestra hoja de cálculo con la tabla de BigQuery (el usuario propietario de la hoja ha de tener acceso al dataset del proyecto de BigQuery en el que se encuentra la tabla).

En este caso analizaremos una tabla de mascotas de equipos de baloncesto de la NCAA, disponible como datos públicos en BigQuery.

Paso 2. Analizando datos de la tabla conectada

  • Veamos una tabla con las diferentes mascotas. Click en Estadísticas de columna > Seleccionar variable categórica ‘mascot’ > nos devuelve la tabla de frecuencias ordenada por defecto de mayor a menor frecuencia. De un total de 351 equipos, 19 tienen como mascota un bulldog.

  • Top 10 mascotas del estado de Carolina.
    Click en Insertar tabla dinámica > mantenemos en Filas la variable ‘mascot’ agregada por COUNT (recuento) > Número de filas: 10 > Filtros > Añadir ‘market’ > Filtrar por condición: El texto contiene: ‘Carolina’ > Aceptar > Aplicar.

Vemos que hay hasta 8 mascotas diferentes en Carolina, siendo el bulldog y el gallo las más frecuentes.

El resultado de esta tabla sería el equivalente a haber realizado la consulta SQL:

  • Gráfico de barras. Click en Gráfico > Crear (en hoja nueva) > Tipo de gráfico: Gráfico de barras > Eje Y: ‘mascot’ > Serie: Añadir serie ‘mascot’ > Tipo de agregado: Recuento > Filtro > Añadir ‘market’ > Filtrar por condición: El texto contiene: ‘Carolina’ > Aceptar > Aplicar Click en Personalizar > podemos añadir título, modificar ejes, leyenda, etc.

Paso 3. Programando actualización de la conexión

Imaginemos que la tabla conectada con la hoja de cálculo se actualiza una vez al mes. 

Para que esta actualización quede reflejada en la hoja de cálculo, nos situamos en la hoja en la que se han volcado los datos > Click en tres puntos junto a Actualizar vista previa > Opciones de actualización > Fijamos la frecuencia de actualización (en este caso, el día 1 de cada mes, entre las 8.00-9.00, teniendo en cuenta la zona horaria existente en la configuración de la hoja de cálculo).

Paso 4. Compartiendo hoja de cálculo con usuario final

Una vez hemos configurado la conexión con la tabla de BigQuery, para que nuestro usuario final pueda acceder a los datos, hemos de compartir la hoja de cálculo con su cuenta.

De esta manera, podrá acceder a la siguiente barra de herramientas y realizar análisis como en el paso 2.

Ventajas 

Las hojas conectadas permiten la explotación de los datos de BigQuery sin que el usuario final acceda a dichas tablas. Esto nos permite un mayor control sobre el acceso, ya que estos permisos se siguen gestionando desde BigQuery.

De esta manera, podemos establecer la conexión de una hoja con una tabla de BigQuery, programar su actualización periódica y compartir la hoja con el usuario final, que podrá realizar su análisis sin necesidad de tener ningún rol de acceso a BigQuery.

Otra de las ventajas es que esta conexión se realiza mediante un conector nativo de Google. Anteriormente ya contábamos con complementos en Sheets que realizaban esta función, pero eran de pago para acciones avanzadas y además dábamos acceso a nuestros datos a terceros.

Buenas prácticas

Una vez más, como siempre que hablamos de conexiones con BigQuery, recomendamos que estas no se hagan sobre tablas de raw data, como las de Google Analytics, ya que su estructura en campos anidados dificultará su análisis a alguien que no domine SQL, además incrementará el coste de consulta y fácilmente podríamos alcanzar el límite de celdas de Google Sheets.

En su lugar, recomendamos establecer la conexión sobre tablas agregadas, con las dimensiones y métricas necesarias para su posterior análisis y visualización. Estas tablas se habrán obtenido mediante consultas SQL sobre el raw data por parte de usuarios con roles de acceso a BigQuery.

Conclusiones

En este post democratizamos el uso de datos almacenados en BigQuery, dirigido a usuarios de Google Sheets sin conocimientos del lenguaje de consulta estructurado SQL.

Share on facebook
Share on twitter
Share on linkedin
Share on email
3 min
Suscríbete a nuestra newsletter

Los mejores artículos de analítica digital para potenciar tu negocio.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Entradas relacionadas

Análisis de supervivencia

En este post haremos una revisión sobre el análisis de supervivencia, comúnmente aplicado en Ciencias de la Salud, considerando su aplicación en el mundo de la analítica.

5 minutos

Dificultad

User Activity API en R

El uso principal de esta API es poder obtener toda la información de un usuario dividida por hit. En este post veremos cómo utilizar la API desde R con ayuda del código y estudiar cuáles serían los resultados.

3 minutos

Dificultad

Aproximación al CLV

El CLV o LTV es una métrica que representa el beneficio económico que obtiene una empresa de un usuario a lo largo del ciclo de relación entre ambos. En este artículo veremos diferentes versiones de esta métrica y cómo calcularlas.

4 minutos

Dificultad

Comparativa de herramientas para procesos ETL

En este post haremos una revisión sobre algunos de los lenguajes/herramientas más utilizados en nuestro ecosistema de analítica digital en procesos de extracción, transformación y carga de datos.

3 minutos

Dificultad

Ir arriba

Esta web utiliza ‘cookies’ de terceros. Al clicar aceptar está aceptando el uso que realizamos de las cookies. Para más información puede consultar nuestra Política de cookies