Lourdes Hernández

Análisis de supervivencia

En este post haremos una revisión sobre el análisis de supervivencia, comúnmente aplicado en Ciencias de la Salud, considerando su aplicación en el mundo de la analítica.

5 minutos

Dificultad

Comparativa de herramientas para procesos ETL

En este post haremos una revisión sobre algunos de los lenguajes/herramientas más utilizados en nuestro ecosistema de analítica digital en procesos de extracción, transformación y carga de datos.

3 minutos

Dificultad

Innodata Barcelona Congreso de Big Data y Analytics

Asistimos a Innodata, Congreso de Big Data & Analytics, donde nos han puesto al día en técnicas de aprendizaje automático y sus aplicaciones, así como herramientas para el tratamiento de grandes volúmenes de datos.

3 minutos

Dificultad

Cómo integrar KNIME con R

Integrar KNIME con R nos permite construir flujos de análisis de datos fácilmente comprensibles.

2 minutos

Dificultad

Asistimos a Vertical Big Data Days 2: Brand Analysis in social network

Las redes sociales proporcionan una ingente cantidad de datos, pero la mayoría sin etiquetar. El Deep Learning nos ayuda a explorarlos para obtener insights sobre nuestra marca. Introducción. La semana pasada tuvimos la oportunidad de asistir a Vertical Big Data Days 2: Brand Analysis in social network, un evento promovido por mVentures en el que

Datos no balanceados. Sobremuestreo, submuestreo y ponderación

Una situación común al enfrentarnos al desarrollo de modelos, ya sean predictivos o de aprendizaje automático, es encontrarnos con datos no balanceados (la probabilidad de ocurrencia de un suceso es muy baja). Introducción. En estos casos, un modelo estimado sobre la base de datos completa tiene menos oportunidad de reconocer diferencias que sobre una base

Asistimos a Data Augmentation, o cómo hacer grandes algoritmos con pocos datos

Un problema habitual en deep learning es la gran cantidad de datos necesaria para el entrenamiento de modelos, lo que podemos solucionar con datos aumentados. La semana pasada tuvimos la oportunidad de asistir a Data Augmentation, o cómo hacer grandes algoritmos con pocos datos, un evento promovido por Trovit en el que Francisco Rodríguez, Data

Lubridate: manipulando fechas en R

El paquete lubridate nos facilita el tratamiento de fechas en R, útil entre otras cosas para preparar nuestros datos antes de un estudio de forecasting. Uno de los puntos fuertes de lubridate reside en formar parte de la colección de librerías tidyverse, una de las más usadas en el ámbito del Data Science. Se caracteriza por el uso

Conectando Data Studio y BigQuery

En anteriores posts se ha introducido Data Studio, la herramienta que Google nos ofrece para la creación de informes y cuadros de mando. Así, en ‘Presentación de la Suite Google Analytics 360’ se nos da a conocer este módulo de reporting, en ‘Google Data Studio: adiós al límite de 5 informes’ se nos anuncia dicha mejora

Googledrive: Conectando R con Drive

En un post anterior conectamos R con Google Sheets. En este aprenderemos cómo interactuar con nuestros archivos de Google Drive desde R, mediante la librería googledrive. Paso 1: Instalar la librería. Debemos tener en cuenta sus dependencias con otros paquetes de R, según se expone en la documentación. Paso 2: Cargar la librería. A continuación citaremos

Ir arriba

Esta web utiliza ‘cookies’ de terceros. Al clicar aceptar está aceptando el uso que realizamos de las cookies. Para más información puede consultar nuestra Política de cookies