estadística

BigQuery Omni: nueva herramienta multi-cloud de GCP para el análisis de datos

Lanzamiento BigQuery Omni BigQuery Omni de Google Cloud es una nueva solución multi-cloud de análisis de datos, impulsada por Anthos, la plataforma de Google que integra aplicaciones híbridas y multi-cloud.  Omni permite a los usuarios ejecutar BigQuery para analizar datos de las nubes de Amazon AWS y Microsoft Azure.  El coste de mover datos entre

Análisis de supervivencia

En este post haremos una revisión sobre el análisis de supervivencia, comúnmente aplicado en Ciencias de la Salud, considerando su aplicación en el mundo de la analítica.

5 minutos

Dificultad

User Activity API en R

El uso principal de esta API es poder obtener toda la información de un usuario dividida por hit. En este post veremos cómo utilizar la API desde R con ayuda del código y estudiar cuáles serían los resultados.

3 minutos

Dificultad

Comparativa de herramientas para procesos ETL

En este post haremos una revisión sobre algunos de los lenguajes/herramientas más utilizados en nuestro ecosistema de analítica digital en procesos de extracción, transformación y carga de datos.

3 minutos

Dificultad

Jupyter Notebook

Jupyter Notebook es una aplicación web de código abierto que permite incluir texto, vídeo, audio e imágenes.

4 minutos

Dificultad

Cómo integrar KNIME con R

Integrar KNIME con R nos permite construir flujos de análisis de datos fácilmente comprensibles.

2 minutos

Dificultad

BigQuery ML: machine learning desde BigQuery

Hace unos meses Google anunció una nueva funcionalidad de Google BigQuery llamada BigQuery ML, la cual está actualmente en Beta. Consiste en un conjunto de extensiones del lenguaje SQL que permiten crear modelos de aprendizaje automático (machine learning, en inglés), evaluar su capacidad predictiva y hacer predicciones para nuevos datos directamente desde dentro de BigQuery.

Datos no balanceados. Sobremuestreo, submuestreo y ponderación

Una situación común al enfrentarnos al desarrollo de modelos, ya sean predictivos o de aprendizaje automático, es encontrarnos con datos no balanceados (la probabilidad de ocurrencia de un suceso es muy baja). Introducción. En estos casos, un modelo estimado sobre la base de datos completa tiene menos oportunidad de reconocer diferencias que sobre una base

Análisis de la dependencia entre dos variables

El objetivo de este artículo es presentar diferentes metodologías para estudiar la dependencia estadística entre dos variables aleatorias cuantitativas. Decimos que dos variables serán independientes cuando no exista ningún tipo de relación entre ellas. Sean X y Y dos variables aleatorias cuantitativas de modo que formen un conjunto de n parejas: Queremos conocer la relación de

Ir arriba

Esta web utiliza ‘cookies’ de terceros. Al clicar aceptar está aceptando el uso que realizamos de las cookies. Para más información puede consultar nuestra Política de cookies