MEDIDAS DE DISPERSIÓN

Estadística Descriptiva

Contenido

  • Introducción a las Medidas de Dispersión
  • Varianza
  • Desviación Estándar
  • Coeficiente de Variación
  • 5 Ejemplos Contextualizados

¿Qué son las Medidas de Dispersión?

Definición

Las medidas de dispersión son estadísticos que nos indican qué tan dispersos o separados están los datos respecto a su centro (media, mediana, etc.).

Mientras las medidas de tendencia central nos dicen "dónde está el centro" de los datos, las medidas de dispersión nos dicen "qué tan alejados están los datos de ese centro".

¿Por qué son importantes?

💡 Ejemplo Intuitivo

Dos estudiantes tienen promedio 6.0, pero uno tiene notas: 6.0, 6.0, 6.0, 6.0 (sin dispersión) y otro tiene: 3.0, 4.0, 7.0, 10.0 (alta dispersión). ¿Son igual de consistentes?

Varianza

Definición

La varianza es el promedio de las distancias al cuadrado de cada dato respecto a la media. Mide qué tan dispersos están los datos respecto al promedio.

Notación: \(s^2\)

Fórmula

Varianza Muestral

$$s^2 = \frac{\displaystyle\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}$$

Donde \(n\) es el tamaño de la muestra y \(\bar{x}\) es la media muestral

🔍 ¿Por qué \(n-1\)?

En la varianza muestral dividimos por \(n-1\) en lugar de \(n\) para obtener un estimador insesgado de la varianza poblacional. Esto se llama corrección de Bessel.

Desviación Estándar

Definición

La desviación estándar es la raíz cuadrada de la varianza. Es la medida de dispersión más utilizada porque está en las mismas unidades que los datos originales.

Notación: \(s\)

Fórmula

Desviación Estándar Muestral

$$s = \sqrt{\frac{\displaystyle\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}}$$

Interpretación

Coeficiente de Variación

Definición

El coeficiente de variación (CV) es una medida de dispersión relativa que expresa la desviación estándar como porcentaje de la media. Es útil para comparar la dispersión de conjuntos de datos con diferentes unidades o escalas.

Notación: \(CV\) o \(C.V.\)

Fórmula del Coeficiente de Variación

$$CV = \frac{s}{\bar{x}} \times 100\%$$

Donde \(s\) es la desviación estándar y \(\bar{x}\) es la media

Interpretación

⚠️ Importante

El coeficiente de variación no tiene sentido cuando la media es cero o cercana a cero, ya que estaríamos dividiendo por un número muy pequeño.

Comparación de las Medidas

Medida Ventajas Desventajas
Varianza Base matemática sólida, útil en estadística avanzada Unidades al cuadrado, difícil de interpretar
Desviación Estándar Mismas unidades que los datos, fácil interpretación Sensible a valores extremos
Coeficiente de Variación Permite comparar dispersiones de diferentes escalas No útil si la media es cero o muy pequeña

¿Cuándo usar Desviación Estándar?

  • Para interpretar la dispersión en términos comprensibles
  • Cuando necesitamos unidades originales
  • Para aplicar la regla empírica (68-95-99.7)

¿Cuándo usar Coeficiente de Variación?

  • Para comparar dispersiones de diferentes variables
  • Cuando las unidades son diferentes
  • Para evaluar consistencia relativa

Ejemplo 1: Notas de Estudiantes

📚 Contexto

Un profesor tiene dos grupos de estudiantes. Quiere saber cuál grupo tiene un rendimiento más consistente. Las notas finales (escala 1-7) son:

  • Grupo A: 5.5, 6.0, 5.8, 6.2, 5.9, 6.1
  • Grupo B: 4.0, 7.0, 5.0, 6.5, 4.5, 6.0

Solución - Grupo A

Paso 1: Calcular la media $$\bar{x}_A = \frac{5.5 + 6.0 + 5.8 + 6.2 + 5.9 + 6.1}{6} = \frac{35.5}{6} = 5.92$$
Paso 2: Calcular la varianza

Primero calculamos las diferencias al cuadrado:

\(x_i\) \(x_i - \bar{x}\) \((x_i - \bar{x})^2\)
5.5-0.420.1764
6.00.080.0064
5.8-0.120.0144
6.20.280.0784
5.9-0.020.0004
6.10.180.0324
$$s^2_A = \frac{0.3084}{6-1} = \frac{0.3084}{5} = 0.062$$

Ejemplo 1: Notas de Estudiantes (cont.)

Solución - Grupo A (continuación)

Paso 3: Calcular la desviación estándar $$s_A = \sqrt{0.062} = 0.249$$
Paso 4: Calcular el coeficiente de variación $$CV_A = \frac{0.249}{5.92} \times 100\% = 4.21\%$$

Solución - Grupo B (resultados)

Aplicando el mismo procedimiento:

📊 Conclusión

El Grupo A tiene menor dispersión (\(s_A = 0.249\) vs \(s_B = 1.16\)) y menor coeficiente de variación (\(CV_A = 4.21\%\) vs \(CV_B = 21.09\%\)), lo que indica que es más consistente en su rendimiento, aunque ambos grupos tienen promedios similares.

Ejemplo 2: Temperatura Mensual

🌡️ Contexto

Una estación meteorológica registró las temperaturas máximas promedio (°C) durante 6 meses:

Temperaturas: 22, 25, 23, 26, 24, 28

Calcular todas las medidas de dispersión para analizar la variabilidad del clima.

Paso 1: Calcular la media $$\bar{x} = \frac{22 + 25 + 23 + 26 + 24 + 28}{6} = \frac{148}{6} = 24.67\,^\circ\text{C}$$
Paso 2: Calcular desviaciones y sus cuadrados
\(x_i\) \(x_i - \bar{x}\) \((x_i - \bar{x})^2\)
22-2.677.13
250.330.11
23-1.672.79
261.331.77
24-0.670.45
283.3311.09
Suma23.34

Ejemplo 2: Temperatura Mensual (cont.)

Paso 3: Calcular la varianza $$s^2 = \frac{\displaystyle\sum (x_i - \bar{x})^2}{n-1} = \frac{23.34}{6-1} = \frac{23.34}{5} = 4.67 \text{ }^\circ\text{C}^2$$
Paso 4: Calcular la desviación estándar $$s = \sqrt{4.67} = 2.16 \text{ }^\circ\text{C}$$
Paso 5: Calcular el coeficiente de variación $$CV = \frac{s}{\bar{x}} \times 100\% = \frac{2.16}{24.67} \times 100\% = 8.76\%$$

📊 Interpretación

  • La temperatura promedio es 24.67°C
  • La desviación estándar de 2.16°C indica que, en promedio, las temperaturas se desvían ±2.16°C de la media
  • El coeficiente de variación de 8.76% (menor a 15%) indica que las temperaturas son bastante homogéneas y predecibles
  • Conclusión: El clima es relativamente estable durante estos meses

Ejemplo 3: Salarios en una Empresa

💼 Contexto

Una empresa pequeña tiene 8 empleados con los siguientes salarios mensuales (en miles de pesos):

Salarios: 500, 520, 480, 510, 1200, 495, 505, 490

Calcular las medidas de dispersión y analizar la distribución salarial.

Paso 1: Calcular la media $$\bar{x} = \frac{500 + 520 + 480 + 510 + 1200 + 495 + 505 + 490}{8} = \frac{4700}{8} = 587.5 \text{ mil pesos}$$
Paso 2: Tabla de cálculo
\(x_i\) \(x_i - \bar{x}\) \((x_i - \bar{x})^2\)
500-87.57656.25
520-67.54556.25
480-107.511556.25
510-77.56006.25
1200612.5375156.25
495-92.58556.25
505-82.56806.25
490-97.59506.25
Suma429800

Ejemplo 3: Salarios en una Empresa (cont.)

Paso 3: Calcular la varianza $$s^2 = \frac{429800}{8-1} = \frac{429800}{7} = 61400 \text{ (mil pesos)}^2$$
Paso 4: Calcular la desviación estándar $$s = \sqrt{61400} = 247.79 \text{ mil pesos}$$
Paso 5: Calcular el coeficiente de variación $$CV = \frac{247.79}{587.5} \times 100\% = 42.17\%$$

📊 Análisis Crítico

  • La desviación estándar de 247.79 mil pesos es muy alta respecto a la mayoría de los salarios
  • El coeficiente de variación de 42.17% (mayor a 30%) indica una dispersión muy alta
  • El salario de 1200 mil pesos es un valor atípico que afecta significativamente las medidas
  • Conclusión: Hay una gran inequidad salarial en la empresa. La mayoría gana alrededor de 500 mil pesos, pero el salario alto distorsiona las estadísticas

Ejemplo 4: Tiempo de Respuesta

⏱️ Contexto

Un call center mide el tiempo de respuesta (en minutos) de sus operadores durante una hora. Los tiempos registrados fueron:

Tiempos: 2.5, 3.0, 2.8, 3.2, 2.7, 3.1, 2.9, 3.0, 2.6, 3.3

Determinar si el servicio es consistente.

Paso 1: Media $$\bar{x} = \frac{2.5 + 3.0 + 2.8 + 3.2 + 2.7 + 3.1 + 2.9 + 3.0 + 2.6 + 3.3}{10} = \frac{29.1}{10} = 2.91 \text{ min}$$
Paso 2: Cálculo de desviaciones
\(x_i\)\((x_i - \bar{x})^2\)
2.50.1681
3.00.0081
2.80.0121
3.20.0841
2.70.0441
3.10.0361
2.90.0001
3.00.0081
2.60.0961
3.30.1521
Suma0.609

Ejemplo 4: Tiempo de Respuesta (cont.)

Paso 3: Varianza $$s^2 = \frac{0.609}{10-1} = \frac{0.609}{9} = 0.0677 \text{ min}^2$$
Paso 4: Desviación estándar $$s = \sqrt{0.0677} = 0.26 \text{ minutos}$$
Paso 5: Coeficiente de variación $$CV = \frac{0.26}{2.91} \times 100\% = 8.93\%$$

📊 Evaluación del Servicio

  • El tiempo promedio de respuesta es 2.91 minutos
  • La desviación estándar de 0.26 minutos (aproximadamente 16 segundos) es muy baja
  • El coeficiente de variación de 8.93% indica alta homogeneidad
  • Conclusión: El servicio del call center es muy consistente y predecible. Los clientes pueden esperar un tiempo de respuesta similar en la mayoría de las llamadas, lo que indica un buen sistema de gestión

Ejemplo 5: Comparación de Inversiones

💰 Contexto

Un inversionista analiza dos opciones de inversión basándose en sus rendimientos mensuales (%) durante 6 meses:

  • Inversión A: 5, 6, 7, 5.5, 6.5, 6 (% mensual)
  • Inversión B: 8, 4, 10, 6, 12, 8 (% mensual)

¿Cuál inversión es más estable?

Cálculos para Inversión A

$$\bar{x}_A = \frac{5 + 6 + 7 + 5.5 + 6.5 + 6}{6} = \frac{36}{6} = 6\%$$
\(x_i\)\((x_i - 6)^2\)
5.01.00
6.00.00
7.01.00
5.50.25
6.50.25
6.00.00
Suma2.50
$$s^2_A = \frac{2.50}{5} = 0.50 \qquad s_A = \sqrt{0.50} = 0.71\%$$ $$CV_A = \frac{0.71}{6} \times 100\% = 11.83\%$$

Ejemplo 5: Comparación de Inversiones (cont.)

Cálculos para Inversión B

$$\bar{x}_B = \frac{8 + 4 + 10 + 6 + 12 + 8}{6} = \frac{48}{6} = 8\%$$
\(x_i\)\((x_i - 8)^2\)
80
416
104
64
1216
80
Suma40
$$s^2_B = \frac{40}{5} = 8 \qquad s_B = \sqrt{8} = 2.83\%$$ $$CV_B = \frac{2.83}{8} \times 100\% = 35.36\%$$

Comparación

InversiónMedia\(s\)CV
A6%0.71%11.83%
B8%2.83%35.36%

Ejemplo 5: Decisión de Inversión

📊 Análisis Comparativo

Inversión A:

  • Rendimiento promedio: 6%
  • Desviación estándar: 0.71% (baja)
  • Coeficiente de variación: 11.83% (bajo → homogéneo)
  • Inversión estable y predecible

Inversión B:

  • Rendimiento promedio: 8% (mayor que A)
  • Desviación estándar: 2.83% (4 veces mayor que A)
  • Coeficiente de variación: 35.36% (alto → heterogéneo)
  • ⚠️ Inversión volátil y riesgosa

🎯 Recomendación

La decisión depende del perfil del inversionista:

  • Perfil conservador: Elegir Inversión A por su estabilidad (CV = 11.83%), aunque tenga menor rendimiento promedio
  • Perfil agresivo: Elegir Inversión B por su mayor rendimiento (8% vs 6%), asumiendo la alta volatilidad (CV = 35.36%)

Este ejemplo demuestra que el coeficiente de variación es crucial para comparar inversiones con diferentes escalas de rendimiento.

Resumen de las Medidas de Dispersión

🔑 Conceptos Clave

  • Varianza \((s^2)\): Promedio de las desviaciones al cuadrado. Base matemática fundamental
  • Desviación Estándar \((s)\): Raíz de la varianza. En las mismas unidades que los datos
  • Coeficiente de Variación (CV): Dispersión relativa en porcentaje. Permite comparar diferentes escalas

¿Cuándo usar cada medida?

Desviación Estándar

  • Interpretación directa
  • Análisis de datos individuales
  • Misma escala de datos
  • Distribuciones normales

Coeficiente de Variación

  • Comparar diferentes variables
  • Diferentes unidades de medida
  • Evaluar homogeneidad
  • Análisis de riesgo relativo

💡 Reflexión Final

Las medidas de dispersión son tan importantes como las medidas de tendencia central. Dos conjuntos de datos pueden tener la misma media pero comportamientos completamente diferentes. Siempre analiza tanto el centro como la dispersión de los datos.

Ejercicios Propuestos

📝 Ejercicio 1: Ventas Semanales

Una tienda registró las siguientes ventas diarias (en miles de pesos) durante una semana:

Datos: 150, 180, 165, 190, 175, 200, 160

Calcular: Media, varianza, desviación estándar y coeficiente de variación.

📝 Ejercicio 2: Comparación de Procesos

Dos máquinas producen piezas. Se mide el tiempo de producción (segundos):

  • Máquina 1: 12, 13, 12.5, 13.2, 12.8
  • Máquina 2: 10, 15, 11, 16, 13

Pregunta: ¿Cuál máquina es más consistente? Justifica usando el CV.

📝 Ejercicio 3: Análisis de Alturas

Las alturas (cm) de 8 estudiantes son: 165, 170, 168, 172, 169, 171, 167, 173

Calcular: Todas las medidas de dispersión e interpretar los resultados.

💪 Desafío Extra

Investiga: ¿Cómo afecta un valor atípico (outlier) a cada una de las medidas de dispersión? Crea un ejemplo numérico que lo demuestre.

¡Gracias por tu atención!

Conceptos aprendidos:

  • ✅ Varianza
  • ✅ Desviación Estándar
  • ✅ Coeficiente de Variación
  • ✅ Aplicaciones prácticas
  • ✅ Interpretación de resultados

"La estadística no es solo calcular números, es entender patrones y tomar decisiones informadas."

¿Preguntas? ¡Sigamos aprendiendo juntos! 🎓