Los datos estan dispersos?
6. Cálculo de Varianza y Desviación Estándar para Datos Agrupados
Cálculo de Varianza y Desviación Estándar para Datos AgrupadosCálculo de Varianza y Desviación Estándar para Datos Agrupados
Repaso
La varianza (\(s^2\) o \(\sigma^2\)) y la desviación estándar (\(s\) o \(\sigma\)) miden la dispersión. Para datos agrupados, usamos fórmulas específicas.
Marca de Clase (\(x_i\))
Usamos la marca de clase (punto medio) como representante de cada intervalo:
Fórmula: \( x_i = \frac{\text{Límite Inferior} + \text{Límite Superior}}{2} \)
Fórmulas (Datos Agrupados)
Media (muestral): \[ \bar{x} = \frac{\sum f_i \cdot x_i}{n} \]
Varianza (muestra): \[ s^2 = \frac{\sum f_i (x_i - \bar{x})^2}{n-1} \]
Desviación Estándar (muestra): \[ s = \sqrt{s^2} \]
Varianza (población): \[ \sigma^2 = \frac{\sum f_i (x_i - \mu)^2}{n} \]
Desviación Estándar (población): \[ \sigma = \sqrt{\sigma^2} \]
(Ver página anterior para la definición de cada símbolo).
Cálculo Paso a Paso (Ejemplo)
Datos: Alturas (cm) de 40 estudiantes:
Intervalo (cm) | Frecuencia (f) |
---|---|
150 - 159 | 5 |
160 - 169 | 12 |
170 - 179 | 15 |
180 - 189 | 8 |
Total | 40 |
Tabla de Cálculo (iremos completándola paso a paso):
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \bar{x}\) | \((x_i - \bar{x})^2\) | \(f_i(x_i - \bar{x})^2\) |
---|---|---|---|---|---|---|
150 - 159 | 5 | |||||
160 - 169 | 12 | |||||
170 - 179 | 15 | |||||
180 - 189 | 8 | |||||
Total | 40 |
- Calcular la marca de clase (\(x_i\)):
Completamos la columna \(x_i\) de la tabla:
Intervalo \(x_i\) \(f_i\) \(f_i \cdot x_i\) \(x_i - \bar{x}\) \((x_i - \bar{x})^2\) \(f_i(x_i - \bar{x})^2\) 150 - 159 154.5 5 160 - 169 164.5 12 170 - 179 174.5 15 180 - 189 184.5 8 Total 40 - Calcular la media ponderada (\(\bar{x}\)):
Completamos la columna \(f_i \cdot x_i\) y calculamos la media:
Intervalo \(x_i\) \(f_i\) \(f_i \cdot x_i\) \(x_i - \bar{x}\) \((x_i - \bar{x})^2\) \(f_i(x_i - \bar{x})^2\) 150 - 159 154.5 5 772.5 160 - 169 164.5 12 1974 170 - 179 174.5 15 2617.5 180 - 189 184.5 8 1476 Total 40 6840 - Calcular las desviaciones (\(x_i - \bar{x}\)):
Completamos la columna \(x_i - \bar{x}\):
Intervalo \(x_i\) \(f_i\) \(f_i \cdot x_i\) \(x_i - \bar{x}\) \((x_i - \bar{x})^2\) \(f_i(x_i - \bar{x})^2\) 150 - 159 154.5 5 772.5 -16.5 160 - 169 164.5 12 1974 -6.5 170 - 179 174.5 15 2617.5 3.5 180 - 189 184.5 8 1476 13.5 Total 40 6840 - Elevar al cuadrado las desviaciones (\((x_i - \bar{x})^2\)):
Completamos la columna \((x_i - \bar{x})^2\):
Intervalo \(x_i\) \(f_i\) \(f_i \cdot x_i\) \(x_i - \bar{x}\) \((x_i - \bar{x})^2\) \(f_i(x_i - \bar{x})^2\) 150 - 159 154.5 5 772.5 -16.5 272.25 160 - 169 164.5 12 1974 -6.5 42.25 170 - 179 174.5 15 2617.5 3.5 12.25 180 - 189 184.5 8 1476 13.5 182.25 Total 40 6840 - Multiplicar por la frecuencia y sumar (\(\sum f_i(x_i - \bar{x})^2\)):
Completamos la última columna y sumamos:
Intervalo \(x_i\) \(f_i\) \(f_i \cdot x_i\) \(x_i - \bar{x}\) \((x_i - \bar{x})^2\) \(f_i(x_i - \bar{x})^2\) 150 - 159 154.5 5 772.5 -16.5 272.25 1361.25 160 - 169 164.5 12 1974 -6.5 42.25 507 170 - 179 174.5 15 2617.5 3.5 12.25 183.75 180 - 189 184.5 8 1476 13.5 182.25 1458 Total 40 6840 3510 - Dividir por n-1 (muestra) o n (población) para obtener la varianza:
Usaremos n-1 (muestra):
Varianza (\(s^2\)) = 3510 / (40 - 1) = 3510 / 39 ≈ 90 - Calcular la raíz cuadrada de la varianza para la desviación estándar: Desviación Estándar (\(s\)) = \(\sqrt{90} \approx 9.49\) cm
Resultado: Varianza muestral ≈ 90 cm², Desviación estándar muestral ≈ 9.49 cm.
Uso de Calculadora/Software
Las calculadoras y hojas de cálculo pueden calcular la desviación estándar para datos agrupados, pero es importante entender el proceso manual.
Ejercicios y Problemas
Ejercicio 1: La siguiente tabla muestra la distribución de edades de los empleados de una empresa:
Edad (años) | Frecuencia |
---|---|
20 - 29 | 10 |
30 - 39 | 15 |
40 - 49 | 12 |
50 - 59 | 8 |
60 - 69 | 5 |
- Completa la tabla con todos los pasos para calcular la varianza y desviación estándar muestrales y calcula estos.
Problema 1: Se realiza un estudio sobre el tiempo (en minutos) que tardan los clientes en ser atendidos en dos sucursales de un banco:
Sucursal A:
Tiempo (min) | Frecuencia |
---|---|
0 - 4 | 10 |
5 - 9 | 15 |
10 - 14 | 8 |
15 - 19 | 5 |
20 - 24 | 2 |
Sucursal B:
Tiempo (min) | Frecuencia |
---|---|
0 - 4 | 5 |
5 - 9 | 10 |
10 - 14 | 15 |
15 - 19 | 12 |
20 - 24 | 8 |
- Calcula la media y la desviación estándar (muestral) para cada sucursal, usando una sola tabla para cada sucursal con todos los pasos.
- ¿En qué sucursal los tiempos de atención son más consistentes (menos variables)?
- ¿En qué sucursal es más probable que un cliente tenga que esperar más de 15 minutos?
© 2024 - Material de Apoyo