Visualización de datos con Python

Por el 13/12/2016 a las 07:59

En un post anterior hicimos una introducción a Python, enfocado al análisis de datos. En él instalamos Python, el paquete pip (encargado del mantenimiento del sistema y la instalación de otros paquetes) y numpy (permite calculo matricial y uso de funciones estadísticas).

Hoy trataremos la visualización de datos con matplotlib, un paquete que pone a nuestra disposición gran variedad de gráficos. Con pocas líneas de código seremos capaces de generar gráficos de tendencia, barras, dispersión, histogramas…

A continuación exponemos tres tipos de visualización de los más usados.

 

1. Gráfico de tendencia: muy útil cuando tenemos escalas de tiempo en el eje horizontal.

plot1_script
1_plot
 

2. Gráfico de burbujas: es un gráfico de dispersión para medir la asociación entre dos variables, introduciendo una tercera que determina el tamaño de la burbuja, o incluso una cuarta, que asigna un color.

plot2_script
2_plot
 

3. Histograma: en la fase exploratoria nos da una idea de la distribución de los datos.

plot3_script
3_plot
 

Recuerden que para consultar la documentación sobre un tipo de gráfico hacemos uso del comando:

help(plt.nombre_función_gráfico), donde plt es el alias de matplotlib.pyplot

A practicar!!!