Visualización de Datos desde Cero

27 de agosto de 2024

La visualización de datos es una herramienta fundamental para entender la información con la que trabajamos. Permite resumir grandes volúmenes de datos en imágenes simples y comprensibles, revelando patrones y tendencias de un solo vistazo. Aunque existen herramientas especializadas como Tableau o Power BI, dominar la visualización en Python sigue siendo una habilidad clave para cualquier Data Scientist.

En este tutorial (basado en este video explicativo), exploramos cómo crear gráficos impactantes y personalizados utilizando las librerías más importantes de Python.

Dos Enfoques: Programación Orientada a Objetos vs. Funcional

Lo primero que explicamos es que en Matplotlib existen dos formas de crear gráficos: la orientada a objetos (más flexible y potente) y la funcional (más rápida para gráficos sencillos).

1. Metodología Orientada a Objetos

Este enfoque nos da control total sobre cada elemento del gráfico. La metodología es simple:
1. Crear la figura y los ejes: El lienzo donde vamos a dibujar.
2. Definir el tipo de gráfico: Indicamos si será de líneas, barras, dispersión, etc.
3. Personalizar: Ajustamos títulos, etiquetas, colores, leyendas y todo lo necesario.

Durante el video, aprendemos a crear los gráficos más comunes: líneas, barras, pastel, histogramas, boxplots y diagramas de dispersión. También vemos cómo personalizar cada detalle: tamaño, ejes (incluyendo doble eje), leyendas, colores y tipos de marcadores.

2. Metodología Funcional

Para visualizaciones rápidas, el enfoque funcional es ideal. Su metodología es más directa:
1. Usar `subplot` (opcional): Si queremos organizar varios gráficos en una misma figura.
2. Plotear el gráfico: Llamamos directamente a la función del gráfico deseado.
3. Personalizar: Añadimos los detalles finales.

3. Un Vistazo a Seaborn

Finalmente, damos una breve introducción a Seaborn, una librería construida sobre Matplotlib que permite crear gráficos estadísticos más complejos y estéticamente agradables con menos código. Revisamos ejemplos como gráficos de barras, `histplot` y el potente `pairplot`, ideal para visualizar relaciones entre múltiples variables a la vez.

Video Tutorial Completo