Los datos estan dispersos?

6. Cálculo de Varianza y Desviación Estándar para Datos Agrupados

Cálculo de Varianza y Desviación Estándar para Datos Agrupados

Cálculo de Varianza y Desviación Estándar para Datos Agrupados

Repaso

La varianza (\(s^2\) o \(\sigma^2\)) y la desviación estándar (\(s\) o \(\sigma\)) miden la dispersión. Para datos agrupados, usamos fórmulas específicas.

Marca de Clase (\(x_i\))

Usamos la marca de clase (punto medio) como representante de cada intervalo:

Fórmula: \( x_i = \frac{\text{Límite Inferior} + \text{Límite Superior}}{2} \)

Fórmulas (Datos Agrupados)

Media (muestral): \[ \bar{x} = \frac{\sum f_i \cdot x_i}{n} \]

Varianza (muestra): \[ s^2 = \frac{\sum f_i (x_i - \bar{x})^2}{n-1} \]

Desviación Estándar (muestra): \[ s = \sqrt{s^2} \]

Varianza (población): \[ \sigma^2 = \frac{\sum f_i (x_i - \mu)^2}{n} \]

Desviación Estándar (población): \[ \sigma = \sqrt{\sigma^2} \]

(Ver página anterior para la definición de cada símbolo).

Cálculo Paso a Paso (Ejemplo)

Datos: Alturas (cm) de 40 estudiantes:

Intervalo (cm)Frecuencia (f)
150 - 1595
160 - 16912
170 - 17915
180 - 1898
Total40

Tabla de Cálculo (iremos completándola paso a paso):

Intervalo\(x_i\)\(f_i\)\(f_i \cdot x_i\)\(x_i - \bar{x}\)\((x_i - \bar{x})^2\)\(f_i(x_i - \bar{x})^2\)
150 - 1595
160 - 16912
170 - 17915
180 - 1898
Total40
  1. Calcular la marca de clase (\(x_i\)):

    Completamos la columna \(x_i\) de la tabla:

    Intervalo\(x_i\)\(f_i\)\(f_i \cdot x_i\)\(x_i - \bar{x}\)\((x_i - \bar{x})^2\)\(f_i(x_i - \bar{x})^2\)
    150 - 159154.55
    160 - 169164.512
    170 - 179174.515
    180 - 189184.58
    Total40
  2. Calcular la media ponderada (\(\bar{x}\)):

    Completamos la columna \(f_i \cdot x_i\) y calculamos la media:

    Intervalo\(x_i\)\(f_i\)\(f_i \cdot x_i\)\(x_i - \bar{x}\)\((x_i - \bar{x})^2\)\(f_i(x_i - \bar{x})^2\)
    150 - 159154.55772.5
    160 - 169164.5121974
    170 - 179174.5152617.5
    180 - 189184.581476
    Total406840
    \[ \bar{x} = \frac{6840}{40} = 171 \]
  3. Calcular las desviaciones (\(x_i - \bar{x}\)):

    Completamos la columna \(x_i - \bar{x}\):

    Intervalo\(x_i\)\(f_i\)\(f_i \cdot x_i\)\(x_i - \bar{x}\)\((x_i - \bar{x})^2\)\(f_i(x_i - \bar{x})^2\)
    150 - 159154.55772.5-16.5
    160 - 169164.5121974-6.5
    170 - 179174.5152617.53.5
    180 - 189184.58147613.5
    Total406840
  4. Elevar al cuadrado las desviaciones (\((x_i - \bar{x})^2\)):

    Completamos la columna \((x_i - \bar{x})^2\):

    Intervalo\(x_i\)\(f_i\)\(f_i \cdot x_i\)\(x_i - \bar{x}\)\((x_i - \bar{x})^2\)\(f_i(x_i - \bar{x})^2\)
    150 - 159154.55772.5-16.5272.25
    160 - 169164.5121974-6.542.25
    170 - 179174.5152617.53.512.25
    180 - 189184.58147613.5182.25
    Total406840
  5. Multiplicar por la frecuencia y sumar (\(\sum f_i(x_i - \bar{x})^2\)):

    Completamos la última columna y sumamos:

    Intervalo\(x_i\)\(f_i\)\(f_i \cdot x_i\)\(x_i - \bar{x}\)\((x_i - \bar{x})^2\)\(f_i(x_i - \bar{x})^2\)
    150 - 159154.55772.5-16.5272.251361.25
    160 - 169164.5121974-6.542.25507
    170 - 179174.5152617.53.512.25183.75
    180 - 189184.58147613.5182.251458
    Total4068403510
  6. Dividir por n-1 (muestra) o n (población) para obtener la varianza:

    Usaremos n-1 (muestra):

    Varianza (\(s^2\)) = 3510 / (40 - 1) = 3510 / 39 ≈ 90
  7. Calcular la raíz cuadrada de la varianza para la desviación estándar: Desviación Estándar (\(s\)) = \(\sqrt{90} \approx 9.49\) cm

Resultado: Varianza muestral ≈ 90 cm², Desviación estándar muestral ≈ 9.49 cm.

Uso de Calculadora/Software

Las calculadoras y hojas de cálculo pueden calcular la desviación estándar para datos agrupados, pero es importante entender el proceso manual.

Ejercicios y Problemas

Ejercicio 1: La siguiente tabla muestra la distribución de edades de los empleados de una empresa:

Edad (años)Frecuencia
20 - 2910
30 - 3915
40 - 4912
50 - 598
60 - 695
  1. Completa la tabla con todos los pasos para calcular la varianza y desviación estándar muestrales y calcula estos.

Problema 1: Se realiza un estudio sobre el tiempo (en minutos) que tardan los clientes en ser atendidos en dos sucursales de un banco:

Sucursal A:

Tiempo (min)Frecuencia
0 - 410
5 - 915
10 - 148
15 - 195
20 - 242

Sucursal B:

Tiempo (min)Frecuencia
0 - 45
5 - 910
10 - 1415
15 - 1912
20 - 248
  1. Calcula la media y la desviación estándar (muestral) para cada sucursal, usando una sola tabla para cada sucursal con todos los pasos.
  2. ¿En qué sucursal los tiempos de atención son más consistentes (menos variables)?
  3. ¿En qué sucursal es más probable que un cliente tenga que esperar más de 15 minutos?

© 2024 - Material de Apoyo