Visualización de datos con Python (con matplotlib)

Hoy trataremos la visualización de datos con matplotlib, un paquete que pone a nuestra disposición gran variedad de gráficos. Con pocas líneas de código seremos capaces de generar gráficos de tendencia, barras, dispersión, histogramas…

En un post anterior hicimos una introducción a Python, enfocado al análisis de datos. En él instalamos Python, el paquete pip (encargado del mantenimiento del sistema y la instalación de otros paquetes) y numpy (permite calculo matricial y uso de funciones estadísticas).

A continuación exponemos tres tipos de visualización de los más usados con matplotlib.

 

1. Gráfico de tendencia: muy útil cuando tenemos escalas de tiempo en el eje horizontal.

matplotlib
matplotlib

2. Gráfico de burbujas: es un gráfico de dispersión para medir la asociación entre dos variables, introduciendo una tercera que determina el tamaño de la burbuja, o incluso una cuarta, que asigna un color.

grafico matplotlib
2_plot

3. Histograma: en la fase exploratoria nos da una idea de la distribución de los datos.

plot3_script
3_plot

Recuerden que para consultar la documentación sobre un tipo de gráfico hacemos uso del comando:

help(plt.nombre_función_gráfico), donde plt es el alias de matplotlib.pyplot

A practicar!!!

Autor:

Cooking data at Metriplica.

2 Comments

  1. ¡Hola!

    La verdad es que no me he metido con python pero después de este post lo voy a probar.

    Que mejor manera que dibujando jejeje

    Gracias por compartir,

  2. Lourdes Hernández

    Hola Jordi,
    Como R lovers, quizá una buena manera de aproximarnos a Python sin alejarnos de nuestra zona de confort sea usar la interfaz ‘reticulate’, que nos permite ejecutar código Python desde el entorno RStudio. Podemos hacer llamadas a módulos, clases y funciones de Python como si fueran nativas de R.

    Gracias por seguirnos!

Leave Comment

Your email address will not be published. Required fields are marked *