Distribuciones estadísticas
20 de agosto de 2024Comprender cómo se distribuyen los datos es una de las habilidades fundamentales en el análisis estadístico. Las distribuciones permiten saber qué valores son más probables, cómo se comporta una variable y qué herramientas podemos utilizar para modelarla correctamente.
En este artículo (basado en este video explicativo), veremos cuatro distribuciones esenciales que todo Data Scientist debe conocer: Bernoulli, Binomial, Poisson y Normal. Se explican de forma sencilla, con visualizaciones y ejemplos.
1. Distribución de Bernoulli
Representa un experimento con dos posibles resultados: éxito (1) o fracaso (0).
Es la base de muchas otras distribuciones.
Ejemplo: lanzar una moneda una sola vez.
Parámetro: p (probabilidad de éxito)
2. Distribución Binomial
Extiende la de Bernoulli a múltiples ensayos. Modela el número de éxitos en n intentos.
Ejemplo: lanzar una moneda 10 veces y contar las caras.
Parámetros: n (número de ensayos), p (probabilidad de éxito)
3. Distribución de Poisson
Modela cuántos eventos ocurren en un intervalo fijo. Ideal para eventos discretos y esporádicos.
Ejemplo: llamadas que recibe una central por minuto.
Parámetro: λ (lambda): tasa promedio de ocurrencia
4. Distribución Normal
La más famosa. Continua, simétrica, con forma de campana. Aparece en muchos fenómenos naturales.
Ejemplo: estaturas, errores de medición, calificaciones.
Parámetros: μ (media), σ (desviación estándar)
Conclusión
Estas cuatro distribuciones son esenciales para cualquier persona que analice datos. Comprenderlas te permite elegir modelos adecuados, interpretar resultados y comunicar hallazgos de forma efectiva.