Hoy trataremos la visualización de datos con matplotlib, un paquete que pone a nuestra disposición gran variedad de gráficos. Con pocas líneas de código seremos capaces de generar gráficos de tendencia, barras, dispersión, histogramas…
En un post anterior hicimos una introducción a Python, enfocado al análisis de datos. En él instalamos Python, el paquete pip (encargado del mantenimiento del sistema y la instalación de otros paquetes) y numpy (permite calculo matricial y uso de funciones estadísticas).
A continuación exponemos tres tipos de visualización de los más usados con matplotlib.
1. Gráfico de tendencia: muy útil cuando tenemos escalas de tiempo en el eje horizontal.
2. Gráfico de burbujas: es un gráfico de dispersión para medir la asociación entre dos variables, introduciendo una tercera que determina el tamaño de la burbuja, o incluso una cuarta, que asigna un color.
3. Histograma: en la fase exploratoria nos da una idea de la distribución de los datos.
Recuerden que para consultar la documentación sobre un tipo de gráfico hacemos uso del comando:
help(plt.nombre_función_gráfico), donde plt es el alias de matplotlib.pyplot
A practicar!!!
2 comentarios en “Visualización de datos con Python (con matplotlib)”
¡Hola!
La verdad es que no me he metido con python pero después de este post lo voy a probar.
Que mejor manera que dibujando jejeje
Gracias por compartir,
Hola Jordi,
Como R lovers, quizá una buena manera de aproximarnos a Python sin alejarnos de nuestra zona de confort sea usar la interfaz ‘reticulate’, que nos permite ejecutar código Python desde el entorno RStudio. Podemos hacer llamadas a módulos, clases y funciones de Python como si fueran nativas de R.
Gracias por seguirnos!