Los datos estan dispersos?
7. Cálculo de Varianza y Desviación Estándar para Datos Agrupados
Cálculo de Varianza y Desviación Estándar para Datos Agrupados
Repaso
La varianza (\(s^2\) o \(\sigma^2\)) y la desviación estándar (\(s\) o \(\sigma\)) son medidas fundamentales que nos indican qué tan dispersos o "alejados" están los datos con respecto a la media (el promedio). Cuando trabajamos con datos agrupados en intervalos (por ejemplo, "personas entre 20 y 30 años"), no conocemos el valor exacto de cada dato, por lo que usamos fórmulas adaptadas.
Para poder operar, necesitamos un valor que represente a cada intervalo. Usamos la marca de clase (\(x_i\)), que es simplemente el punto medio del intervalo.
Marca de Clase: \[ x_i = \frac{\text{Límite Inferior} + \text{Límite Superior}}{2} \]
A partir de ahí, las fórmulas son las siguientes (asumiendo que los datos son una muestra):
- Media (promedio): \[ \bar{x} = \frac{\sum f_i \cdot x_i}{n} \] (Donde \(f_i\) es la frecuencia de cada intervalo y \(n\) el total de datos).
- Varianza (muestral): \[ s^2 = \frac{\sum f_i (x_i - \bar{x})^2}{n-1} \]
- Desviación Estándar (muestral): \[ s = \sqrt{s^2} \]
Un error muy común es confundir la fórmula de la varianza para una muestra (se divide por \(n-1\)) con la de una población (se divide por \(N\)). En la mayoría de los casos prácticos y ejercicios, trabajamos con muestras de una población más grande, por lo que usaremos \(n-1\). ¡Presta atención al enunciado!
Cálculo Paso a Paso (Ejemplo Guiado)
Datos: Se midió la altura (en cm) de una muestra de 40 estudiantes, obteniendo la siguiente tabla de frecuencias.
Intervalo (cm) | Frecuencia (\(f_i\)) |
---|---|
[150 - 160) | 5 |
[160 - 170) | 12 |
[170 - 180) | 15 |
[180 - 190) | 8 |
Total | 40 |
Para calcular la varianza y desviación estándar, construiremos una tabla que nos ayudará a organizar todos los cálculos. ¡Vamos paso a paso!
Tabla de Trabajo Inicial:
Comenzamos con esta tabla, donde solo tenemos los datos iniciales. Nuestro objetivo es completar las columnas vacías.
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \bar{x}\) | \((x_i - \bar{x})^2\) | \(f_i(x_i - \bar{x})^2\) |
---|---|---|---|---|---|---|
[150 - 160) | 5 | |||||
[160 - 170) | 12 | |||||
[170 - 180) | 15 | |||||
[180 - 190) | 8 | |||||
Total | 40 |
Tabla de Cálculo Completa:
Ahora, completamos cada columna secuencialmente hasta obtener todos los valores necesarios para nuestras fórmulas.
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \bar{x}\) | \((x_i - \bar{x})^2\) | \(f_i(x_i - \bar{x})^2\) |
---|---|---|---|---|---|---|
[150 - 160) | 155 | 5 | 775 | -16.5 | 272.25 | 1361.25 |
[160 - 170) | 165 | 12 | 1980 | -6.5 | 42.25 | 507 |
[170 - 180) | 175 | 15 | 2625 | 3.5 | 12.25 | 183.75 |
[180 - 190) | 185 | 8 | 1480 | 13.5 | 182.25 | 1458 |
Total | \(n=40\) | \(\sum = 6840\) | \(\sum = 3510\) |
Cálculos finales:
Media: \(\bar{x} = \frac{6840}{40} = 171\) cm
Varianza (muestral): \(s^2 = \frac{3510}{40-1} = \frac{3510}{39} \approx 90 \text{ cm}^2\)
Desviación Estándar (muestral): \(s = \sqrt{90} \approx 9.49\) cm
Resultado: La altura promedio es de 171 cm, con una desviación estándar de aproximadamente 9.49 cm, lo que nos indica la dispersión típica de las alturas respecto a ese promedio.
Una desviación estándar pequeña significa que la mayoría de los datos están muy agrupados cerca de la media (son muy consistentes). Una desviación estándar grande indica que los datos están más esparcidos y son más variables. Es una medida clave para comparar la consistencia entre diferentes conjuntos de datos.
Ejercicios y Problemas
Nivel 1:
Cálculos de varianza y Desviación estándar
Ejercicio 1: Edades en una Empresa
La siguiente tabla muestra la distribución de edades (en años) de los empleados de una empresa. Calcula la media, la varianza y la desviación estándar muestrales.
Edad (años) | Frecuencia |
---|---|
[20 - 30) | 10 |
[30 - 40) | 15 |
[40 - 50) | 12 |
[50 - 60) | 8 |
[60 - 70) | 5 |
Tabla de Cálculo:
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \bar{x}\) | \((x_i - \bar{x})^2\) | \(f_i(x_i - \bar{x})^2\) |
---|---|---|---|---|---|---|
[20 - 30) | 25 | 10 | 250 | -16.6 | 275.56 | 2755.6 |
[30 - 40) | 35 | 15 | 525 | -6.6 | 43.56 | 653.4 |
[40 - 50) | 45 | 12 | 540 | 3.4 | 11.56 | 138.72 |
[50 - 60) | 55 | 8 | 440 | 13.4 | 179.56 | 1436.48 |
[60 - 70) | 65 | 5 | 322.5 | 23.4 | 547.56 | 2737.8 |
Total | 50 | 2055 | 7722 |
- Media: \(\bar{x} = \frac{2055}{50} = 41.1\) años
- Varianza: \(s^2 = \frac{7722}{49} \approx 157.59\) años²
- Desviación estándar: \(s = \sqrt{157.59} \approx 12.55\) años
Ejercicio 2: Calificaciones de un Curso
Un profesor registra las calificaciones finales de su curso de estadística en la siguiente tabla. Considerando los datos como una muestra de todos sus estudiantes históricos, calcula la nota promedio, la varianza y la desviación estándar para evaluar el rendimiento y la consistencia del grupo.
Calificación | Nº de Estudiantes (\(f_i\)) |
---|---|
[1.0 - 2.0) | 2 |
[2.0 - 3.0) | 5 |
[3.0 - 4.0) | 8 |
[4.0 - 5.0) | 15 |
[5.0 - 6.0) | 12 |
[6.0 - 7.0] | 8 |
Tabla de Cálculo:
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \bar{x}\) | \((x_i - \bar{x})^2\) | \(f_i(x_i - \bar{x})^2\) |
---|---|---|---|---|---|---|
[1.0 - 2.0) | 1.5 | 2 | 3.0 | -3.08 | 9.4864 | 18.9728 |
[2.0 - 3.0) | 2.5 | 5 | 12.5 | -2.08 | 4.3264 | 21.632 |
[3.0 - 4.0) | 3.5 | 8 | 28.0 | -1.08 | 1.1664 | 9.3312 |
[4.0 - 5.0) | 4.5 | 15 | 67.5 | -0.08 | 0.0064 | 0.096 |
[5.0 - 6.0) | 5.5 | 12 | 66.0 | 0.92 | 0.8464 | 10.1568 |
[6.0 - 7.0] | 6.5 | 8 | 52.0 | 1.92 | 3.6864 | 29.4912 |
Total | 50 | 229.0 | 89.68 |
- Media: \(\bar{x} = \frac{229}{50} = 4.58\) puntos
- Varianza: \(s^2 = \frac{89.68}{49} \approx 1.83\) puntos²
- Desviación estándar: \(s = \sqrt{1.83} \approx 1.35\) puntos
Ejercicio 3: Control de Calidad en Pesaje de Café
Una empresa que envasa café toma una muestra de 80 paquetes de "250 gramos" para verificar la consistencia de sus máquinas. Los pesos reales (en gramos) se registran en la siguiente tabla. Calcula la desviación estándar para determinar qué tan preciso es el proceso de envasado.
Peso (gramos) | Nº de Paquetes (\(f_i\)) |
---|---|
[240 - 244) | 7 |
[244 - 248) | 15 |
[248 - 252) | 35 |
[252 - 256) | 18 |
[256 - 260] | 5 |
Tabla de Cálculo:
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \bar{x}\) | \((x_i - \bar{x})^2\) | \(f_i(x_i - \bar{x})^2\) |
---|---|---|---|---|---|---|
[240 - 244) | 242 | 7 | 1694 | -7.95 | 63.2025 | 442.4175 |
[244 - 248) | 246 | 15 | 3690 | -3.95 | 15.6025 | 234.0375 |
[248 - 252) | 250 | 35 | 8750 | 0.05 | 0.0025 | 0.0875 |
[252 - 256) | 254 | 18 | 4572 | 4.05 | 16.4025 | 295.245 |
[256 - 260] | 258 | 5 | 1290 | 8.05 | 64.8025 | 324.0125 |
Total | 80 | 19996 | 1295.8 |
- Media: \(\bar{x} = \frac{19996}{80} = 249.95\) gramos
- Varianza: \(s^2 = \frac{1295.8}{79} \approx 16.40\) gr²
- Desviación estándar: \(s = \sqrt{16.40} \approx 4.05\) gramos