Datos , tablas , medidas centrales

6. Media en datos agrupados

Media en datos agrupados [marca de clase, aproximación] (PAES M1)

Objetivo de la clase: calcular e interpretar la media en datos agrupados usando la marca de clase, comprendiendo que el resultado obtenido es una aproximación del promedio real.

Cuando los datos están agrupados por intervalos, ya no conocemos cada valor exacto del conjunto. En ese caso, la media no se puede calcular de manera exacta como en los datos sueltos, sino que se estima usando la marca de clase de cada intervalo.

Por eso, en esta unidad la media en datos agrupados debe entenderse como una aproximación. Aun así, sigue siendo muy útil para resumir la distribución y comparar grupos, algo que aparece con frecuencia en ejercicios tipo PAES M1.

📐 Fórmula de la media en datos agrupados

Si una tabla tiene marcas de clase \(x_i\) y frecuencias absolutas \(f_i\), la media agrupada se calcula con:

\[ \bar{x}\approx \dfrac{x_1f_1+x_2f_2+\cdots+x_kf_k}{n} \]

donde \(n=f_1+f_2+\cdots+f_k\) es el total de datos.

🤓 ¿Por qué aparece el símbolo \(\approx\)?

Aparece porque no estamos usando los datos reales uno por uno, sino la marca de clase como representante de todos los valores de cada intervalo. Eso permite estimar la media, pero no garantiza que coincida exactamente con el promedio real del conjunto.

💡 Estrategia de cálculo
  1. Identifica la marca de clase de cada intervalo.
  2. Multiplica cada marca de clase por su frecuencia.
  3. Suma todos los productos \(x_i\cdot f_i\).
  4. Suma las frecuencias para obtener el total \(n\).
  5. Divide: \[ \bar{x}\approx\dfrac{\sum x_if_i}{n} \]
⚠️ Error conceptual frecuente

La media en datos agrupados no suele ser exacta. Se trata de una estimación. El error más común es olvidar esto y hablar del resultado como si fuera el promedio exacto de todos los datos originales.

Ejemplo 1: cálculo básico de la media agrupada

La siguiente tabla resume las edades de 20 personas:

Intervalo Marca de clase \(x_i\) \(f_i\) \(x_i\cdot f_i\)
\(10{-}14\) 12 2 24
\(15{-}19\) 17 6 102
\(20{-}24\) 22 6 132
\(25{-}29\) 27 5 135
\(30{-}34\) 32 1 32
Total - 20 425

Aplicamos la fórmula:

\[ \bar{x}\approx\dfrac{425}{20}=21{,}25 \]

Interpretación: la edad media del grupo es aproximadamente \(21{,}25\) años.

Ejemplo 2: por qué es una aproximación

Supongamos que en el intervalo \(20{-}24\) hay 6 personas. En la media agrupada, a esas 6 personas se les representa usando la marca de clase \(22\).

Eso equivale a tratar el grupo como si sus 6 edades fueran aproximadamente 22. Pero en realidad podrían ser, por ejemplo, \(20,\ 21,\ 22,\ 23,\ 24,\ 24\), o alguna otra combinación.

Por eso, la media agrupada:

  • usa información resumida,
  • pierde detalle respecto de los datos originales,
  • y entrega una estimación razonable del promedio.

Ejemplo 3: lectura de una tabla y cálculo completo

La siguiente tabla muestra los tiempos de traslado, en minutos, de 25 estudiantes:

Intervalo Marca de clase \(x_i\) \(f_i\) \(x_i\cdot f_i\)
\(0{-}9\) \(4{,}5\) 4 18
\(10{-}19\) \(14{,}5\) 8 116
\(20{-}29\) \(24{,}5\) 7 171{,}5
\(30{-}39\) \(34{,}5\) 4 138
\(40{-}49\) \(44{,}5\) 2 89
Total - 25 532{,}5

Entonces:

\[ \bar{x}\approx\dfrac{532{,}5}{25}=21{,}3 \]

Interpretación: el tiempo promedio de traslado es aproximadamente \(21{,}3\) minutos.

Ejemplo 4: comparación con datos no agrupados

En datos sueltos, la media se calcula con los valores exactos del conjunto. En cambio, en datos agrupados se usan marcas de clase.

Eso significa que la media agrupada es más rápida de calcular cuando hay muchos datos, pero menos precisa que la media exacta.

Situación Tipo de media
Se conocen todos los datos exactos Media exacta
Los datos están resumidos en intervalos Media aproximada
🌍 Uso en el mundo real

La media agrupada se usa cuando hay grandes cantidades de datos resumidos en rangos, por ejemplo edades de una población, tiempos de espera, ingresos, estaturas o puntajes. En esos contextos, la tabla permite obtener una estimación útil sin revisar uno por uno todos los valores originales.

🤓 Relación con lo aprendido antes

En la clase anterior viste que la marca de clase representa el punto medio de cada intervalo. Aquí esa idea se vuelve fundamental, porque cada marca de clase actúa como representante de todo el intervalo al calcular la media agrupada.

Ejercicios de práctica

  1. Calcula la media aproximada de la tabla con intervalos \(0{-}4,\ 5{-}9,\ 10{-}14\) y frecuencias \(2,\ 5,\ 3\).
  2. Construye la columna \(x_i\cdot f_i\) para una tabla con marcas de clase \(3,\ 8,\ 13\) y frecuencias \(4,\ 2,\ 1\).
  3. En una tabla agrupada, las marcas de clase son \(12,\ 17,\ 22\) y las frecuencias son \(3,\ 4,\ 3\). Calcula la media aproximada.
  4. Explica por qué en datos agrupados la media es una aproximación y no un valor exacto.
  5. Si la suma \(\sum x_if_i\) es 180 y el total de datos es 12, calcula la media agrupada.
  6. En una distribución con marcas de clase \(5,\ 15,\ 25,\ 35\) y frecuencias \(2,\ 4,\ 3,\ 1\), calcula la media aproximada.
  7. Si una tabla tiene intervalos \(10{-}19,\ 20{-}29,\ 30{-}39\), determina sus marcas de clase.
  8. En una tabla agrupada, el total de frecuencias es 30 y la suma de los productos \(x_if_i\) es 690. ¿Cuál es la media?
  9. Compara las expresiones “media exacta” y “media aproximada” en el contexto estadístico.
  10. Una tabla tiene marcas de clase \(4{,}5,\ 14{,}5,\ 24{,}5\) y frecuencias \(6,\ 8,\ 6\). Calcula la media aproximada.
  11. ¿Qué papel cumple la marca de clase en el cálculo de la media agrupada?
  12. En una tabla agrupada, ¿qué ocurre con la media aproximada si aumentan las frecuencias de los intervalos altos? Explica brevemente.
💡 Pista para PAES

En preguntas de media agrupada, revisa siempre tres cosas: la marca de clase, el producto \(x_i\cdot f_i\) y el total de frecuencias. Muchos errores aparecen por olvidar uno de esos pasos.

Ejercicios tipo PAES

  1. En una tabla agrupada, las marcas de clase son \(5,\ 15,\ 25\) y las frecuencias son \(2,\ 3,\ 5\). La media aproximada es:
    1. \(18\)
    2. \(20\)
    3. \(17\)
    4. \(22\)
  2. La razón principal por la que la media en datos agrupados se considera una aproximación es que:
    1. las frecuencias siempre son decimales
    2. la media no puede calcularse nunca en tablas
    3. se reemplazan los datos reales por marcas de clase
    4. los intervalos aparentes y reales son distintos
  3. Si en una tabla agrupada se tiene \(\sum x_if_i=360\) y \(n=18\), entonces la media aproximada es:
    1. \(22\)
    2. \(18\)
    3. \(20\)
    4. \(24\)
  4. Las marcas de clase de los intervalos \(10{-}19,\ 20{-}29,\ 30{-}39\) son:
    1. \(14,\ 24,\ 34\)
    2. \(14{,}5,\ 24{,}5,\ 34{,}5\)
    3. \(15,\ 25,\ 35\)
    4. \(9{,}5,\ 19{,}5,\ 29{,}5\)
  5. En una tabla con marcas de clase \(4,\ 8,\ 12\) y frecuencias \(1,\ 3,\ 2\), el valor de \(\sum x_if_i\) es:
    1. \(40\)
    2. \(52\)
    3. \(32\)
    4. \(28\)
  6. Si aumentan las frecuencias de los intervalos con mayor marca de clase, entonces es esperable que la media agrupada:
    1. disminuya
    2. permanezca igual
    3. aumente
    4. desaparezca
⚠️ Conclusión importante

La media en datos agrupados es una herramienta muy útil para resumir distribuciones extensas, pero siempre debe interpretarse como una aproximación. En PAES M1 no basta con aplicar la fórmula: también debes comprender por qué el resultado es estimado y qué información lo sustenta.