Datos , tablas , medidas centrales
6. Media en datos agrupados
Media en datos agrupados [marca de clase, aproximación] (PAES M1)
Objetivo de la clase: calcular e interpretar la media en datos agrupados usando la marca de clase, comprendiendo que el resultado obtenido es una aproximación del promedio real.
Cuando los datos están agrupados por intervalos, ya no conocemos cada valor exacto del conjunto. En ese caso, la media no se puede calcular de manera exacta como en los datos sueltos, sino que se estima usando la marca de clase de cada intervalo.
Por eso, en esta unidad la media en datos agrupados debe entenderse como una aproximación. Aun así, sigue siendo muy útil para resumir la distribución y comparar grupos, algo que aparece con frecuencia en ejercicios tipo PAES M1.
Si una tabla tiene marcas de clase \(x_i\) y frecuencias absolutas \(f_i\), la media agrupada se calcula con:
\[ \bar{x}\approx \dfrac{x_1f_1+x_2f_2+\cdots+x_kf_k}{n} \]
donde \(n=f_1+f_2+\cdots+f_k\) es el total de datos.
Aparece porque no estamos usando los datos reales uno por uno, sino la marca de clase como representante de todos los valores de cada intervalo. Eso permite estimar la media, pero no garantiza que coincida exactamente con el promedio real del conjunto.
- Identifica la marca de clase de cada intervalo.
- Multiplica cada marca de clase por su frecuencia.
- Suma todos los productos \(x_i\cdot f_i\).
- Suma las frecuencias para obtener el total \(n\).
- Divide: \[ \bar{x}\approx\dfrac{\sum x_if_i}{n} \]
La media en datos agrupados no suele ser exacta. Se trata de una estimación. El error más común es olvidar esto y hablar del resultado como si fuera el promedio exacto de todos los datos originales.
Ejemplo 1: cálculo básico de la media agrupada
La siguiente tabla resume las edades de 20 personas:
| Intervalo | Marca de clase \(x_i\) | \(f_i\) | \(x_i\cdot f_i\) |
|---|---|---|---|
| \(10{-}14\) | 12 | 2 | 24 |
| \(15{-}19\) | 17 | 6 | 102 |
| \(20{-}24\) | 22 | 6 | 132 |
| \(25{-}29\) | 27 | 5 | 135 |
| \(30{-}34\) | 32 | 1 | 32 |
| Total | - | 20 | 425 |
Aplicamos la fórmula:
\[ \bar{x}\approx\dfrac{425}{20}=21{,}25 \]
Interpretación: la edad media del grupo es aproximadamente \(21{,}25\) años.
Ejemplo 2: por qué es una aproximación
Supongamos que en el intervalo \(20{-}24\) hay 6 personas. En la media agrupada, a esas 6 personas se les representa usando la marca de clase \(22\).
Eso equivale a tratar el grupo como si sus 6 edades fueran aproximadamente 22. Pero en realidad podrían ser, por ejemplo, \(20,\ 21,\ 22,\ 23,\ 24,\ 24\), o alguna otra combinación.
Por eso, la media agrupada:
- usa información resumida,
- pierde detalle respecto de los datos originales,
- y entrega una estimación razonable del promedio.
Ejemplo 3: lectura de una tabla y cálculo completo
La siguiente tabla muestra los tiempos de traslado, en minutos, de 25 estudiantes:
| Intervalo | Marca de clase \(x_i\) | \(f_i\) | \(x_i\cdot f_i\) |
|---|---|---|---|
| \(0{-}9\) | \(4{,}5\) | 4 | 18 |
| \(10{-}19\) | \(14{,}5\) | 8 | 116 |
| \(20{-}29\) | \(24{,}5\) | 7 | 171{,}5 |
| \(30{-}39\) | \(34{,}5\) | 4 | 138 |
| \(40{-}49\) | \(44{,}5\) | 2 | 89 |
| Total | - | 25 | 532{,}5 |
Entonces:
\[ \bar{x}\approx\dfrac{532{,}5}{25}=21{,}3 \]
Interpretación: el tiempo promedio de traslado es aproximadamente \(21{,}3\) minutos.
Ejemplo 4: comparación con datos no agrupados
En datos sueltos, la media se calcula con los valores exactos del conjunto. En cambio, en datos agrupados se usan marcas de clase.
Eso significa que la media agrupada es más rápida de calcular cuando hay muchos datos, pero menos precisa que la media exacta.
| Situación | Tipo de media |
|---|---|
| Se conocen todos los datos exactos | Media exacta |
| Los datos están resumidos en intervalos | Media aproximada |
La media agrupada se usa cuando hay grandes cantidades de datos resumidos en rangos, por ejemplo edades de una población, tiempos de espera, ingresos, estaturas o puntajes. En esos contextos, la tabla permite obtener una estimación útil sin revisar uno por uno todos los valores originales.
En la clase anterior viste que la marca de clase representa el punto medio de cada intervalo. Aquí esa idea se vuelve fundamental, porque cada marca de clase actúa como representante de todo el intervalo al calcular la media agrupada.
Ejercicios de práctica
- Calcula la media aproximada de la tabla con intervalos \(0{-}4,\ 5{-}9,\ 10{-}14\) y frecuencias \(2,\ 5,\ 3\).
- Construye la columna \(x_i\cdot f_i\) para una tabla con marcas de clase \(3,\ 8,\ 13\) y frecuencias \(4,\ 2,\ 1\).
- En una tabla agrupada, las marcas de clase son \(12,\ 17,\ 22\) y las frecuencias son \(3,\ 4,\ 3\). Calcula la media aproximada.
- Explica por qué en datos agrupados la media es una aproximación y no un valor exacto.
- Si la suma \(\sum x_if_i\) es 180 y el total de datos es 12, calcula la media agrupada.
- En una distribución con marcas de clase \(5,\ 15,\ 25,\ 35\) y frecuencias \(2,\ 4,\ 3,\ 1\), calcula la media aproximada.
- Si una tabla tiene intervalos \(10{-}19,\ 20{-}29,\ 30{-}39\), determina sus marcas de clase.
- En una tabla agrupada, el total de frecuencias es 30 y la suma de los productos \(x_if_i\) es 690. ¿Cuál es la media?
- Compara las expresiones “media exacta” y “media aproximada” en el contexto estadístico.
- Una tabla tiene marcas de clase \(4{,}5,\ 14{,}5,\ 24{,}5\) y frecuencias \(6,\ 8,\ 6\). Calcula la media aproximada.
- ¿Qué papel cumple la marca de clase en el cálculo de la media agrupada?
- En una tabla agrupada, ¿qué ocurre con la media aproximada si aumentan las frecuencias de los intervalos altos? Explica brevemente.
- Las marcas de clase son \(2,\ 7,\ 12\).
Entonces: \[ \bar{x}\approx\dfrac{2\cdot 2+7\cdot 5+12\cdot 3}{2+5+3} =\dfrac{4+35+36}{10} =\dfrac{75}{10}=7{,}5 \] - \[ 3\cdot 4=12,\qquad 8\cdot 2=16,\qquad 13\cdot 1=13 \] La columna \(x_i\cdot f_i\) es: \(12,\ 16,\ 13\).
- \[ \bar{x}\approx\dfrac{12\cdot 3+17\cdot 4+22\cdot 3}{3+4+3} =\dfrac{36+68+66}{10} =\dfrac{170}{10}=17 \]
- Porque no se usan los datos originales uno por uno, sino la marca de clase como representante de cada intervalo.
- \[ \bar{x}\approx\dfrac{180}{12}=15 \]
- \[ \bar{x}\approx\dfrac{5\cdot 2+15\cdot 4+25\cdot 3+35\cdot 1}{2+4+3+1} =\dfrac{10+60+75+35}{10} =18 \]
- \[ \dfrac{10+19}{2}=14{,}5,\qquad \dfrac{20+29}{2}=24{,}5,\qquad \dfrac{30+39}{2}=34{,}5 \]
- \[ \bar{x}\approx\dfrac{690}{30}=23 \]
- La media exacta usa todos los datos reales del conjunto. La media aproximada usa marcas de clase porque los datos están agrupados por intervalos.
- \[ \bar{x}\approx\dfrac{4{,}5\cdot 6+14{,}5\cdot 8+24{,}5\cdot 6}{6+8+6} =\dfrac{27+116+147}{20} =\dfrac{290}{20}=14{,}5 \]
- La marca de clase representa el valor central de cada intervalo y se usa como sustituto de los datos reales al calcular la media agrupada.
- La media aproximada tiende a aumentar, porque más datos se concentran en intervalos con marcas de clase más altas.
En preguntas de media agrupada, revisa siempre tres cosas: la marca de clase, el producto \(x_i\cdot f_i\) y el total de frecuencias. Muchos errores aparecen por olvidar uno de esos pasos.
Ejercicios tipo PAES
- En una tabla agrupada, las marcas de clase son \(5,\ 15,\ 25\) y las frecuencias son \(2,\ 3,\ 5\). La media aproximada es:
- \(18\)
- \(20\)
- \(17\)
- \(22\)
- La razón principal por la que la media en datos agrupados se considera una aproximación es que:
- las frecuencias siempre son decimales
- la media no puede calcularse nunca en tablas
- se reemplazan los datos reales por marcas de clase
- los intervalos aparentes y reales son distintos
- Si en una tabla agrupada se tiene \(\sum x_if_i=360\) y \(n=18\), entonces la media aproximada es:
- \(22\)
- \(18\)
- \(20\)
- \(24\)
- Las marcas de clase de los intervalos \(10{-}19,\ 20{-}29,\ 30{-}39\) son:
- \(14,\ 24,\ 34\)
- \(14{,}5,\ 24{,}5,\ 34{,}5\)
- \(15,\ 25,\ 35\)
- \(9{,}5,\ 19{,}5,\ 29{,}5\)
- En una tabla con marcas de clase \(4,\ 8,\ 12\) y frecuencias \(1,\ 3,\ 2\), el valor de \(\sum x_if_i\) es:
- \(40\)
- \(52\)
- \(32\)
- \(28\)
- Si aumentan las frecuencias de los intervalos con mayor marca de clase, entonces es esperable que la media agrupada:
- disminuya
- permanezca igual
- aumente
- desaparezca
- \[ \bar{x}\approx\dfrac{5\cdot 2+15\cdot 3+25\cdot 5}{2+3+5} =\dfrac{10+45+125}{10} =\dfrac{180}{10}=18 \] Respuesta correcta: A
- La media es aproximada porque cada intervalo se representa por su marca de clase en lugar de usar todos los datos exactos.
Respuesta correcta: C - \[ \bar{x}\approx\dfrac{360}{18}=20 \] Respuesta correcta: C
- \[ \dfrac{10+19}{2}=14{,}5,\qquad \dfrac{20+29}{2}=24{,}5,\qquad \dfrac{30+39}{2}=34{,}5 \] Respuesta correcta: B
- \[ \sum x_if_i=4\cdot 1+8\cdot 3+12\cdot 2=4+24+24=52 \] Respuesta correcta: B
- Si hay más datos en intervalos altos, la media tiende a subir.
Respuesta correcta: C
La media en datos agrupados es una herramienta muy útil para resumir distribuciones extensas, pero siempre debe interpretarse como una aproximación. En PAES M1 no basta con aplicar la fórmula: también debes comprender por qué el resultado es estimado y qué información lo sustenta.
