7. Cálculo de Varianza y Desviación Estándar para Datos Agrupados

Cálculo de Varianza y Desviación Estándar para Datos Agrupados

Repaso

La varianza (\(s^2\) o \(\sigma^2\)) y la desviación estándar (\(s\) o \(\sigma\)) son medidas fundamentales que nos indican qué tan dispersos o "alejados" están los datos con respecto a la media (el promedio). Cuando trabajamos con datos agrupados en intervalos (por ejemplo, "personas entre 20 y 30 años"), no conocemos el valor exacto de cada dato, por lo que usamos fórmulas adaptadas.

📐 Procedimientos y Fórmulas Clave

Para poder operar, necesitamos un valor que represente a cada intervalo. Usamos la marca de clase (\(x_i\)), que es simplemente el punto medio del intervalo.

Marca de Clase: \[ x_i = \frac{\text{Límite Inferior} + \text{Límite Superior}}{2} \]

A partir de ahí, las fórmulas son las siguientes (asumiendo que los datos son una muestra):

  • Media (promedio): \[ \bar{x} = \frac{\sum f_i \cdot x_i}{n} \] (Donde \(f_i\) es la frecuencia de cada intervalo y \(n\) el total de datos).
  • Varianza (muestral): \[ s^2 = \frac{\sum f_i (x_i - \bar{x})^2}{n-1} \]
  • Desviación Estándar (muestral): \[ s = \sqrt{s^2} \]
⚠️ ¡Cuidado con la División!

Un error muy común es confundir la fórmula de la varianza para una muestra (se divide por \(n-1\)) con la de una población (se divide por \(N\)). En la mayoría de los casos prácticos y ejercicios, trabajamos con muestras de una población más grande, por lo que usaremos \(n-1\). ¡Presta atención al enunciado!

Cálculo Paso a Paso (Ejemplo Guiado)

Datos: Se midió la altura (en cm) de una muestra de 40 estudiantes, obteniendo la siguiente tabla de frecuencias.

Intervalo (cm) Frecuencia (\(f_i\))
[150 - 160) 5
[160 - 170) 12
[170 - 180) 15
[180 - 190) 8
Total 40

Para calcular la varianza y desviación estándar, construiremos una tabla que nos ayudará a organizar todos los cálculos. ¡Vamos paso a paso!

Tabla de Trabajo Inicial:

Comenzamos con esta tabla, donde solo tenemos los datos iniciales. Nuestro objetivo es completar las columnas vacías.

Intervalo \(x_i\) \(f_i\) \(f_i \cdot x_i\) \(x_i - \bar{x}\) \((x_i - \bar{x})^2\) \(f_i(x_i - \bar{x})^2\)
[150 - 160)   5        
[160 - 170)   12        
[170 - 180)   15        
[180 - 190)   8        
Total   40        

Tabla de Cálculo Completa:

Ahora, completamos cada columna secuencialmente hasta obtener todos los valores necesarios para nuestras fórmulas.

Intervalo \(x_i\) \(f_i\) \(f_i \cdot x_i\) \(x_i - \bar{x}\) \((x_i - \bar{x})^2\) \(f_i(x_i - \bar{x})^2\)
[150 - 160) 155 5 775 -16.5 272.25 1361.25
[160 - 170) 165 12 1980 -6.5 42.25 507
[170 - 180) 175 15 2625 3.5 12.25 183.75
[180 - 190) 185 8 1480 13.5 182.25 1458
Total   \(n=40\) \(\sum = 6840\)     \(\sum = 3510\)

Cálculos finales:

Media: \(\bar{x} = \frac{6840}{40} = 171\) cm

Varianza (muestral): \(s^2 = \frac{3510}{40-1} = \frac{3510}{39} \approx 90 \text{ cm}^2\)

Desviación Estándar (muestral): \(s = \sqrt{90} \approx 9.49\) cm

Resultado: La altura promedio es de 171 cm, con una desviación estándar de aproximadamente 9.49 cm, lo que nos indica la dispersión típica de las alturas respecto a ese promedio.

💡 ¿Qué significa la Desviación Estándar en la práctica?

Una desviación estándar pequeña significa que la mayoría de los datos están muy agrupados cerca de la media (son muy consistentes). Una desviación estándar grande indica que los datos están más esparcidos y son más variables. Es una medida clave para comparar la consistencia entre diferentes conjuntos de datos.

Ejercicios y Problemas

Nivel 1:

Cálculos de varianza y Desviación estándar

Ejercicio 1: Edades en una Empresa

La siguiente tabla muestra la distribución de edades (en años) de los empleados de una empresa. Calcula la media, la varianza y la desviación estándar muestrales.

Edad (años) Frecuencia
[20 - 30) 10
[30 - 40) 15
[40 - 50) 12
[50 - 60) 8
[60 - 70) 5

Ejercicio 2: Calificaciones de un Curso

Un profesor registra las calificaciones finales de su curso de estadística en la siguiente tabla. Considerando los datos como una muestra de todos sus estudiantes históricos, calcula la nota promedio, la varianza y la desviación estándar para evaluar el rendimiento y la consistencia del grupo.

Calificación Nº de Estudiantes (\(f_i\))
[1.0 - 2.0) 2
[2.0 - 3.0) 5
[3.0 - 4.0) 8
[4.0 - 5.0) 15
[5.0 - 6.0) 12
[6.0 - 7.0] 8

Ejercicio 3: Control de Calidad en Pesaje de Café

Una empresa que envasa café toma una muestra de 80 paquetes de "250 gramos" para verificar la consistencia de sus máquinas. Los pesos reales (en gramos) se registran en la siguiente tabla. Calcula la desviación estándar para determinar qué tan preciso es el proceso de envasado.

Peso (gramos) Nº de Paquetes (\(f_i\))
[240 - 244) 7
[244 - 248) 15
[248 - 252) 35
[252 - 256) 18
[256 - 260] 5