MEDIDAS DE DISPERSIÓN
Estadística Descriptiva
Contenido
- Introducción a las Medidas de Dispersión
- Varianza
- Desviación Estándar
- Coeficiente de Variación
- 5 Ejemplos Contextualizados
¿Qué son las Medidas de Dispersión?
Definición
Las medidas de dispersión son estadísticos que nos indican qué tan dispersos o separados están los datos respecto a su centro (media, mediana, etc.).
Mientras las medidas de tendencia central nos dicen "dónde está el centro" de los datos, las medidas de dispersión nos dicen "qué tan alejados están los datos de ese centro".
¿Por qué son importantes?
- Dos conjuntos de datos pueden tener la misma media pero diferente dispersión
- Nos permiten entender la variabilidad y consistencia de los datos
- Son fundamentales para la toma de decisiones basadas en datos
- Ayudan a identificar valores atípicos y patrones
💡 Ejemplo Intuitivo
Dos estudiantes tienen promedio 6.0, pero uno tiene notas: 6.0, 6.0, 6.0, 6.0 (sin dispersión) y otro tiene: 3.0, 4.0, 7.0, 10.0 (alta dispersión). ¿Son igual de consistentes?
Varianza
Definición
La varianza es el promedio de las distancias al cuadrado de cada dato respecto a la media. Mide qué tan dispersos están los datos respecto al promedio.
Notación: \(s^2\)
Fórmula
🔍 ¿Por qué \(n-1\)?
En la varianza muestral dividimos por \(n-1\) en lugar de \(n\) para obtener un estimador insesgado de la varianza poblacional. Esto se llama corrección de Bessel.
Desviación Estándar
Definición
La desviación estándar es la raíz cuadrada de la varianza. Es la medida de dispersión más utilizada porque está en las mismas unidades que los datos originales.
Notación: \(s\)
Fórmula
Desviación Estándar Muestral
$$s = \sqrt{\frac{\displaystyle\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}}$$
Interpretación
- Una desviación estándar pequeña indica que los datos están concentrados cerca de la media
- Una desviación estándar grande indica que los datos están muy dispersos
- Si \(s = 0\), todos los datos son idénticos
Coeficiente de Variación
Definición
El coeficiente de variación (CV) es una medida de dispersión relativa que expresa la desviación estándar como porcentaje de la media. Es útil para comparar la dispersión de conjuntos de datos con diferentes unidades o escalas.
Notación: \(CV\) o \(C.V.\)
Interpretación
- CV bajo (< 15%): Los datos son homogéneos o poco dispersos
- CV medio (15% - 30%): Dispersión moderada
- CV alto (> 30%): Los datos son heterogéneos o muy dispersos
⚠️ Importante
El coeficiente de variación no tiene sentido cuando la media es cero o cercana a cero, ya que estaríamos dividiendo por un número muy pequeño.
Comparación de las Medidas
| Medida |
Ventajas |
Desventajas |
| Varianza |
Base matemática sólida, útil en estadística avanzada |
Unidades al cuadrado, difícil de interpretar |
| Desviación Estándar |
Mismas unidades que los datos, fácil interpretación |
Sensible a valores extremos |
| Coeficiente de Variación |
Permite comparar dispersiones de diferentes escalas |
No útil si la media es cero o muy pequeña |
¿Cuándo usar Desviación Estándar?
- Para interpretar la dispersión en términos comprensibles
- Cuando necesitamos unidades originales
- Para aplicar la regla empírica (68-95-99.7)
¿Cuándo usar Coeficiente de Variación?
- Para comparar dispersiones de diferentes variables
- Cuando las unidades son diferentes
- Para evaluar consistencia relativa
Ejemplo 1: Notas de Estudiantes
📚 Contexto
Un profesor tiene dos grupos de estudiantes. Quiere saber cuál grupo tiene un rendimiento más consistente. Las notas finales (escala 1-7) son:
- Grupo A: 5.5, 6.0, 5.8, 6.2, 5.9, 6.1
- Grupo B: 4.0, 7.0, 5.0, 6.5, 4.5, 6.0
Solución - Grupo A
Paso 1: Calcular la media
$$\bar{x}_A = \frac{5.5 + 6.0 + 5.8 + 6.2 + 5.9 + 6.1}{6} = \frac{35.5}{6} = 5.92$$
Paso 2: Calcular la varianza
Primero calculamos las diferencias al cuadrado:
| \(x_i\) |
\(x_i - \bar{x}\) |
\((x_i - \bar{x})^2\) |
| 5.5 | -0.42 | 0.1764 |
| 6.0 | 0.08 | 0.0064 |
| 5.8 | -0.12 | 0.0144 |
| 6.2 | 0.28 | 0.0784 |
| 5.9 | -0.02 | 0.0004 |
| 6.1 | 0.18 | 0.0324 |
$$s^2_A = \frac{0.3084}{6-1} = \frac{0.3084}{5} = 0.062$$
Ejemplo 1: Notas de Estudiantes (cont.)
Solución - Grupo A (continuación)
Paso 3: Calcular la desviación estándar
$$s_A = \sqrt{0.062} = 0.249$$
Paso 4: Calcular el coeficiente de variación
$$CV_A = \frac{0.249}{5.92} \times 100\% = 4.21\%$$
Solución - Grupo B (resultados)
Aplicando el mismo procedimiento:
- Media: \(\bar{x}_B = 5.50\)
- Varianza: \(s^2_B = 1.35\)
- Desviación Estándar: \(s_B = 1.16\)
- Coeficiente de Variación: \(CV_B = 21.09\%\)
📊 Conclusión
El Grupo A tiene menor dispersión (\(s_A = 0.249\) vs \(s_B = 1.16\)) y menor coeficiente de variación (\(CV_A = 4.21\%\) vs \(CV_B = 21.09\%\)), lo que indica que es más consistente en su rendimiento, aunque ambos grupos tienen promedios similares.
Ejemplo 2: Temperatura Mensual
🌡️ Contexto
Una estación meteorológica registró las temperaturas máximas promedio (°C) durante 6 meses:
Temperaturas: 22, 25, 23, 26, 24, 28
Calcular todas las medidas de dispersión para analizar la variabilidad del clima.
Paso 1: Calcular la media
$$\bar{x} = \frac{22 + 25 + 23 + 26 + 24 + 28}{6} = \frac{148}{6} = 24.67\,^\circ\text{C}$$
Paso 2: Calcular desviaciones y sus cuadrados
| \(x_i\) |
\(x_i - \bar{x}\) |
\((x_i - \bar{x})^2\) |
| 22 | -2.67 | 7.13 |
| 25 | 0.33 | 0.11 |
| 23 | -1.67 | 2.79 |
| 26 | 1.33 | 1.77 |
| 24 | -0.67 | 0.45 |
| 28 | 3.33 | 11.09 |
| Suma | 23.34 |
Ejemplo 2: Temperatura Mensual (cont.)
Paso 3: Calcular la varianza
$$s^2 = \frac{\displaystyle\sum (x_i - \bar{x})^2}{n-1} = \frac{23.34}{6-1} = \frac{23.34}{5} = 4.67 \text{ }^\circ\text{C}^2$$
Paso 4: Calcular la desviación estándar
$$s = \sqrt{4.67} = 2.16 \text{ }^\circ\text{C}$$
Paso 5: Calcular el coeficiente de variación
$$CV = \frac{s}{\bar{x}} \times 100\% = \frac{2.16}{24.67} \times 100\% = 8.76\%$$
📊 Interpretación
- La temperatura promedio es 24.67°C
- La desviación estándar de 2.16°C indica que, en promedio, las temperaturas se desvían ±2.16°C de la media
- El coeficiente de variación de 8.76% (menor a 15%) indica que las temperaturas son bastante homogéneas y predecibles
- Conclusión: El clima es relativamente estable durante estos meses
Ejemplo 3: Salarios en una Empresa
💼 Contexto
Una empresa pequeña tiene 8 empleados con los siguientes salarios mensuales (en miles de pesos):
Salarios: 500, 520, 480, 510, 1200, 495, 505, 490
Calcular las medidas de dispersión y analizar la distribución salarial.
Paso 1: Calcular la media
$$\bar{x} = \frac{500 + 520 + 480 + 510 + 1200 + 495 + 505 + 490}{8} = \frac{4700}{8} = 587.5 \text{ mil pesos}$$
Paso 2: Tabla de cálculo
| \(x_i\) |
\(x_i - \bar{x}\) |
\((x_i - \bar{x})^2\) |
| 500 | -87.5 | 7656.25 |
| 520 | -67.5 | 4556.25 |
| 480 | -107.5 | 11556.25 |
| 510 | -77.5 | 6006.25 |
| 1200 | 612.5 | 375156.25 |
| 495 | -92.5 | 8556.25 |
| 505 | -82.5 | 6806.25 |
| 490 | -97.5 | 9506.25 |
| Suma | 429800 |
Ejemplo 3: Salarios en una Empresa (cont.)
Paso 3: Calcular la varianza
$$s^2 = \frac{429800}{8-1} = \frac{429800}{7} = 61400 \text{ (mil pesos)}^2$$
Paso 4: Calcular la desviación estándar
$$s = \sqrt{61400} = 247.79 \text{ mil pesos}$$
Paso 5: Calcular el coeficiente de variación
$$CV = \frac{247.79}{587.5} \times 100\% = 42.17\%$$
📊 Análisis Crítico
- La desviación estándar de 247.79 mil pesos es muy alta respecto a la mayoría de los salarios
- El coeficiente de variación de 42.17% (mayor a 30%) indica una dispersión muy alta
- El salario de 1200 mil pesos es un valor atípico que afecta significativamente las medidas
- Conclusión: Hay una gran inequidad salarial en la empresa. La mayoría gana alrededor de 500 mil pesos, pero el salario alto distorsiona las estadísticas
Ejemplo 4: Tiempo de Respuesta
⏱️ Contexto
Un call center mide el tiempo de respuesta (en minutos) de sus operadores durante una hora. Los tiempos registrados fueron:
Tiempos: 2.5, 3.0, 2.8, 3.2, 2.7, 3.1, 2.9, 3.0, 2.6, 3.3
Determinar si el servicio es consistente.
Paso 1: Media
$$\bar{x} = \frac{2.5 + 3.0 + 2.8 + 3.2 + 2.7 + 3.1 + 2.9 + 3.0 + 2.6 + 3.3}{10} = \frac{29.1}{10} = 2.91 \text{ min}$$
Paso 2: Cálculo de desviaciones
| \(x_i\) | \((x_i - \bar{x})^2\) |
| 2.5 | 0.1681 |
| 3.0 | 0.0081 |
| 2.8 | 0.0121 |
| 3.2 | 0.0841 |
| 2.7 | 0.0441 |
| 3.1 | 0.0361 |
| 2.9 | 0.0001 |
| 3.0 | 0.0081 |
| 2.6 | 0.0961 |
| 3.3 | 0.1521 |
| Suma | 0.609 |
Ejemplo 4: Tiempo de Respuesta (cont.)
Paso 3: Varianza
$$s^2 = \frac{0.609}{10-1} = \frac{0.609}{9} = 0.0677 \text{ min}^2$$
Paso 4: Desviación estándar
$$s = \sqrt{0.0677} = 0.26 \text{ minutos}$$
Paso 5: Coeficiente de variación
$$CV = \frac{0.26}{2.91} \times 100\% = 8.93\%$$
📊 Evaluación del Servicio
- El tiempo promedio de respuesta es 2.91 minutos
- La desviación estándar de 0.26 minutos (aproximadamente 16 segundos) es muy baja
- El coeficiente de variación de 8.93% indica alta homogeneidad
- Conclusión: El servicio del call center es muy consistente y predecible. Los clientes pueden esperar un tiempo de respuesta similar en la mayoría de las llamadas, lo que indica un buen sistema de gestión
Ejemplo 5: Comparación de Inversiones
💰 Contexto
Un inversionista analiza dos opciones de inversión basándose en sus rendimientos mensuales (%) durante 6 meses:
- Inversión A: 5, 6, 7, 5.5, 6.5, 6 (% mensual)
- Inversión B: 8, 4, 10, 6, 12, 8 (% mensual)
¿Cuál inversión es más estable?
Cálculos para Inversión A
$$\bar{x}_A = \frac{5 + 6 + 7 + 5.5 + 6.5 + 6}{6} = \frac{36}{6} = 6\%$$
| \(x_i\) | \((x_i - 6)^2\) |
| 5.0 | 1.00 |
| 6.0 | 0.00 |
| 7.0 | 1.00 |
| 5.5 | 0.25 |
| 6.5 | 0.25 |
| 6.0 | 0.00 |
| Suma | 2.50 |
$$s^2_A = \frac{2.50}{5} = 0.50 \qquad s_A = \sqrt{0.50} = 0.71\%$$
$$CV_A = \frac{0.71}{6} \times 100\% = 11.83\%$$
Ejemplo 5: Comparación de Inversiones (cont.)
Cálculos para Inversión B
$$\bar{x}_B = \frac{8 + 4 + 10 + 6 + 12 + 8}{6} = \frac{48}{6} = 8\%$$
| \(x_i\) | \((x_i - 8)^2\) |
| 8 | 0 |
| 4 | 16 |
| 10 | 4 |
| 6 | 4 |
| 12 | 16 |
| 8 | 0 |
| Suma | 40 |
$$s^2_B = \frac{40}{5} = 8 \qquad s_B = \sqrt{8} = 2.83\%$$
$$CV_B = \frac{2.83}{8} \times 100\% = 35.36\%$$
Comparación
| Inversión | Media | \(s\) | CV |
| A | 6% | 0.71% | 11.83% |
| B | 8% | 2.83% | 35.36% |
Ejemplo 5: Decisión de Inversión
📊 Análisis Comparativo
Inversión A:
- Rendimiento promedio: 6%
- Desviación estándar: 0.71% (baja)
- Coeficiente de variación: 11.83% (bajo → homogéneo)
- ✅ Inversión estable y predecible
Inversión B:
- Rendimiento promedio: 8% (mayor que A)
- Desviación estándar: 2.83% (4 veces mayor que A)
- Coeficiente de variación: 35.36% (alto → heterogéneo)
- ⚠️ Inversión volátil y riesgosa
🎯 Recomendación
La decisión depende del perfil del inversionista:
- Perfil conservador: Elegir Inversión A por su estabilidad (CV = 11.83%), aunque tenga menor rendimiento promedio
- Perfil agresivo: Elegir Inversión B por su mayor rendimiento (8% vs 6%), asumiendo la alta volatilidad (CV = 35.36%)
Este ejemplo demuestra que el coeficiente de variación es crucial para comparar inversiones con diferentes escalas de rendimiento.
Resumen de las Medidas de Dispersión
🔑 Conceptos Clave
- Varianza \((s^2)\): Promedio de las desviaciones al cuadrado. Base matemática fundamental
- Desviación Estándar \((s)\): Raíz de la varianza. En las mismas unidades que los datos
- Coeficiente de Variación (CV): Dispersión relativa en porcentaje. Permite comparar diferentes escalas
¿Cuándo usar cada medida?
Desviación Estándar
- Interpretación directa
- Análisis de datos individuales
- Misma escala de datos
- Distribuciones normales
Coeficiente de Variación
- Comparar diferentes variables
- Diferentes unidades de medida
- Evaluar homogeneidad
- Análisis de riesgo relativo
💡 Reflexión Final
Las medidas de dispersión son tan importantes como las medidas de tendencia central. Dos conjuntos de datos pueden tener la misma media pero comportamientos completamente diferentes. Siempre analiza tanto el centro como la dispersión de los datos.
Ejercicios Propuestos
📝 Ejercicio 1: Ventas Semanales
Una tienda registró las siguientes ventas diarias (en miles de pesos) durante una semana:
Datos: 150, 180, 165, 190, 175, 200, 160
Calcular: Media, varianza, desviación estándar y coeficiente de variación.
📝 Ejercicio 2: Comparación de Procesos
Dos máquinas producen piezas. Se mide el tiempo de producción (segundos):
- Máquina 1: 12, 13, 12.5, 13.2, 12.8
- Máquina 2: 10, 15, 11, 16, 13
Pregunta: ¿Cuál máquina es más consistente? Justifica usando el CV.
📝 Ejercicio 3: Análisis de Alturas
Las alturas (cm) de 8 estudiantes son: 165, 170, 168, 172, 169, 171, 167, 173
Calcular: Todas las medidas de dispersión e interpretar los resultados.
💪 Desafío Extra
Investiga: ¿Cómo afecta un valor atípico (outlier) a cada una de las medidas de dispersión? Crea un ejemplo numérico que lo demuestre.
¡Gracias por tu atención!
Conceptos aprendidos:
- ✅ Varianza
- ✅ Desviación Estándar
- ✅ Coeficiente de Variación
- ✅ Aplicaciones prácticas
- ✅ Interpretación de resultados
"La estadística no es solo calcular números, es entender patrones y tomar decisiones informadas."
¿Preguntas? ¡Sigamos aprendiendo juntos! 🎓