Datos , tablas , medidas centrales
7. Mediana en datos agrupados
Mediana en datos agrupados [intervalo mediano, cálculo e interpretación] (PAES M1)
Objetivo de la clase: identificar el intervalo mediano en una tabla de datos agrupados, calcular la mediana mediante interpolación e interpretar su significado dentro de una distribución.
Cuando los datos están agrupados en intervalos, ya no conocemos cada valor exacto del conjunto. Por eso, la mediana no se obtiene observando directamente el dato central, sino estimándola dentro del intervalo mediano.
En esta clase aprenderás no solo a ubicar el intervalo que contiene la mediana, sino también a calcular una aproximación de la mediana usando una fórmula específica para datos agrupados.
La mediana es el valor que divide al conjunto en dos partes: aproximadamente el 50% de los datos queda por debajo y aproximadamente el 50% queda por encima.
En datos agrupados, primero se identifica el intervalo mediano usando la frecuencia acumulada y luego se estima la mediana dentro de ese intervalo.
- Calcula el total de datos \(n\).
- Busca el valor: \[ \dfrac{n}{2} \]
- Observa la frecuencia acumulada y localiza el primer intervalo cuya frecuencia acumulada iguala o supera a \(\dfrac{n}{2}\).
- Ese intervalo es el intervalo mediano.
Una vez identificado el intervalo mediano, la mediana se estima con:
\[ \mathrm{Me}\approx L_i+\left(\dfrac{\frac{n}{2}-F_{anterior}}{f_m}\right)\cdot a \]
donde:
- \(L_i\): límite inferior real del intervalo mediano,
- \(n\): total de datos,
- \(F_{anterior}\): frecuencia acumulada anterior al intervalo mediano,
- \(f_m\): frecuencia del intervalo mediano,
- \(a\): amplitud del intervalo.
Porque dentro del intervalo mediano no conocemos la ubicación exacta de cada dato. La fórmula supone que los datos del intervalo están distribuidos de manera uniforme y, con esa idea, estima dónde se encuentra el valor central.
- Calcula \(\dfrac{n}{2}\).
- Encuentra el intervalo mediano con la frecuencia acumulada.
- Extrae los 4 datos clave: \(L_i\), \(F_{anterior}\), \(f_m\) y \(a\).
- Reemplaza en la fórmula con cuidado.
- Interpreta el resultado dentro del contexto.
Ejemplo 1: encontrar el intervalo mediano
La siguiente tabla resume los tiempos de lectura, en minutos, de 20 estudiantes:
| Intervalo aparente | Intervalo real | \(f\) | \(F\) |
|---|---|---|---|
| \(0{-}9\) | \(-0{,}5 \le x < 9{,}5\) | 3 | 3 |
| \(10{-}19\) | \(9{,}5 \le x < 19{,}5\) | 5 | 8 |
| \(20{-}29\) | \(19{,}5 \le x < 29{,}5\) | 6 | 14 |
| \(30{-}39\) | \(29{,}5 \le x < 39{,}5\) | 4 | 18 |
| \(40{-}49\) | \(39{,}5 \le x < 49{,}5\) | 2 | 20 |
Como el total es \(n=20\), buscamos:
\[ \dfrac{20}{2}=10 \]
La frecuencia acumulada pasa de 8 a 14 en el intervalo \(20{-}29\), por lo tanto ese es el intervalo mediano.
Ejemplo 2: cálculo de la mediana agrupada
Usamos la tabla anterior.
Ya sabemos que el intervalo mediano es \(20{-}29\), cuyo intervalo real es:
\[ 19{,}5 \le x < 29{,}5 \]
Entonces identificamos los datos de la fórmula:
- \(L_i=19{,}5\)
- \(n=20\)
- \(\dfrac{n}{2}=10\)
- \(F_{anterior}=8\)
- \(f_m=6\)
- \(a=10\)
Reemplazamos:
\[ \mathrm{Me}\approx 19{,}5+\left(\dfrac{10-8}{6}\right)\cdot 10 \]
\[ \mathrm{Me}\approx 19{,}5+\left(\dfrac{2}{6}\right)\cdot 10 \]
\[ \mathrm{Me}\approx 19{,}5+3{,}33 \]
\[ \mathrm{Me}\approx 22{,}83 \]
Conclusión: la mediana es aproximadamente \(22{,}83\) minutos.
Ejemplo 3: interpretación de la mediana
El valor \(\mathrm{Me}\approx 22{,}83\) indica que aproximadamente la mitad de los estudiantes tiene tiempos de lectura menores que \(22{,}83\) minutos, y la otra mitad tiene tiempos mayores.
Como se trata de datos agrupados, este valor es una estimación del centro de la distribución.
Ejemplo 4: otro cálculo completo
Observa la siguiente tabla de estaturas de 30 estudiantes:
| Intervalo aparente | Intervalo real | \(f\) | \(F\) |
|---|---|---|---|
| \(140{-}149\) | \(139{,}5 \le x < 149{,}5\) | 3 | 3 |
| \(150{-}159\) | \(149{,}5 \le x < 159{,}5\) | 8 | 11 |
| \(160{-}169\) | \(159{,}5 \le x < 169{,}5\) | 10 | 21 |
| \(170{-}179\) | \(169{,}5 \le x < 179{,}5\) | 6 | 27 |
| \(180{-}189\) | \(179{,}5 \le x < 189{,}5\) | 3 | 30 |
Primero calculamos:
\[ \dfrac{30}{2}=15 \]
La frecuencia acumulada pasa de 11 a 21 en el intervalo \(160{-}169\), por lo tanto ese es el intervalo mediano.
Ahora extraemos los datos:
- \(L_i=159{,}5\)
- \(F_{anterior}=11\)
- \(f_m=10\)
- \(a=10\)
Aplicamos la fórmula:
\[ \mathrm{Me}\approx 159{,}5+\left(\dfrac{15-11}{10}\right)\cdot 10 \]
\[ \mathrm{Me}\approx 159{,}5+4 \]
\[ \mathrm{Me}\approx 163{,}5 \]
Interpretación: la estatura mediana es aproximadamente \(163{,}5\) cm.
- Confundir el intervalo mediano con el intervalo modal.
- Usar el límite inferior aparente en vez del límite inferior real.
- Tomar \(F\) del intervalo mediano en lugar de usar la frecuencia acumulada anterior.
- Usar mal la amplitud del intervalo.
- Creer que la mediana agrupada es exacta y no una aproximación.
La mediana permite ubicar el centro de una distribución aun cuando los datos estén resumidos en intervalos. Es especialmente útil cuando interesa describir un valor central sin dejarse influir demasiado por valores extremos.
En datos sueltos, la mediana se encuentra buscando el dato central del conjunto ordenado. En datos agrupados, esa idea se mantiene, pero ahora el centro se estima dentro del intervalo mediano usando una interpolación.
Ejercicios de práctica
- En una tabla agrupada con \(n=40\), ¿qué valor debes calcular primero para buscar la mediana?
- Explica qué es el intervalo mediano.
- Si en una tabla el intervalo mediano tiene \(L_i=29{,}5\), \(F_{anterior}=12\), \(f_m=8\), \(a=10\) y \(n=40\), calcula la mediana.
- En una distribución con \(n=50\), si la frecuencia acumulada anterior al intervalo mediano es 18 y la frecuencia del intervalo mediano es 12, con \(L_i=39{,}5\) y \(a=10\), calcula la mediana.
- ¿Por qué en la fórmula se usa la frecuencia acumulada anterior y no la del propio intervalo mediano?
- En una tabla agrupada, la mediana quedó aproximadamente en \(24{,}7\). Interpreta ese resultado.
- Si el intervalo mediano es \(60{-}69\), con intervalo real \(59{,}5 \le x < 69{,}5\), frecuencia 15, acumulada anterior 20, total 70 y amplitud 10, calcula la mediana.
- Explica por qué la mediana agrupada es una aproximación.
- ¿Qué ocurre con la mediana si el valor \(\dfrac{n}{2}\) cae exactamente al inicio de un intervalo?
- ¿Qué papel cumple la amplitud del intervalo en la fórmula de la mediana agrupada?
- En una tabla, \(n=24\), \(L_i=19{,}5\), \(F_{anterior}=9\), \(f_m=6\), \(a=10\). Calcula la mediana.
- Diferencia con tus palabras “encontrar el intervalo mediano” y “calcular la mediana agrupada”.
- Se calcula: \[ \dfrac{40}{2}=20 \]
- Es el intervalo cuya frecuencia acumulada es la primera que iguala o supera a \(\dfrac{n}{2}\), es decir, el intervalo donde se encuentra la posición central.
- \[ \mathrm{Me}\approx 29{,}5+\left(\dfrac{20-12}{8}\right)\cdot 10 \] \[ \mathrm{Me}\approx 29{,}5+10 \] \[ \mathrm{Me}\approx 39{,}5 \]
- \[ \mathrm{Me}\approx 39{,}5+\left(\dfrac{25-18}{12}\right)\cdot 10 \] \[ \mathrm{Me}\approx 39{,}5+\dfrac{70}{12} \] \[ \mathrm{Me}\approx 39{,}5+5{,}83 \] \[ \mathrm{Me}\approx 45{,}33 \]
- Porque esa frecuencia indica cuántos datos se han acumulado antes de entrar al intervalo mediano, y permite ubicar cuánto falta avanzar dentro de él para llegar al 50%.
- Significa que aproximadamente la mitad de los datos es menor que \(24{,}7\) y la otra mitad es mayor que ese valor.
- \[ \dfrac{70}{2}=35 \] \[ \mathrm{Me}\approx 59{,}5+\left(\dfrac{35-20}{15}\right)\cdot 10 \] \[ \mathrm{Me}\approx 59{,}5+10 \] \[ \mathrm{Me}\approx 69{,}5 \]
- Porque no conocemos los datos exactos dentro de cada intervalo, solo sus frecuencias. La fórmula estima dónde está el centro suponiendo una distribución uniforme dentro del intervalo mediano.
- Que la mediana coincide con el límite inferior real de ese intervalo.
- La amplitud indica cuánto “ancho” tiene el intervalo y permite estimar qué parte de ese ancho hay que recorrer para llegar a la mediana.
- \[ \dfrac{24}{2}=12 \] \[ \mathrm{Me}\approx 19{,}5+\left(\dfrac{12-9}{6}\right)\cdot 10 \] \[ \mathrm{Me}\approx 19{,}5+5 \] \[ \mathrm{Me}\approx 24{,}5 \]
- Encontrar el intervalo mediano es identificar la clase donde está el centro de la distribución. Calcular la mediana agrupada es estimar un valor específico dentro de ese intervalo usando la fórmula.
En ejercicios de mediana agrupada, separa mentalmente el proceso en dos partes: primero ubicar el intervalo mediano y luego reemplazar correctamente los datos en la fórmula.
Ejercicios tipo PAES
- En una tabla agrupada con \(n=32\), el valor que se busca primero para localizar la mediana es:
- \(8\)
- \(32\)
- \(16\)
- \(15\)
- La fórmula de la mediana agrupada usa:
- el límite inferior real del intervalo mediano
- la marca de clase del intervalo modal
- la frecuencia relativa acumulada final
- el límite superior aparente del primer intervalo
- Si \(n=40\), \(L_i=19{,}5\), \(F_{anterior}=14\), \(f_m=10\) y \(a=10\), la mediana es:
- \(23{,}5\)
- \(25{,}5\)
- \(29{,}5\)
- \(20{,}5\)
- El intervalo mediano es el primer intervalo cuya frecuencia acumulada:
- es menor que \(\dfrac{n}{2}\)
- supera o iguala a \(\dfrac{n}{2}\)
- coincide con la frecuencia simple mayor
- es exactamente igual a 1
- Si en una tabla agrupada la mediana estimada es \(54{,}2\), entonces:
- ese valor necesariamente aparece en los datos originales
- el 54,2% de los datos está bajo ese valor
- aproximadamente la mitad de los datos queda por debajo de ese valor
- la media debe ser igual a 54,2
- En la fórmula de la mediana agrupada, \(F_{anterior}\) representa:
- la frecuencia del intervalo mediano
- la frecuencia acumulada anterior al intervalo mediano
- la frecuencia relativa del último intervalo
- la suma de todas las frecuencias
- \[ \dfrac{32}{2}=16 \] Respuesta correcta: C
- La fórmula usa el límite inferior real del intervalo mediano.
Respuesta correcta: A - \[ \mathrm{Me}\approx 19{,}5+\left(\dfrac{20-14}{10}\right)\cdot 10 \] \[ \mathrm{Me}\approx 19{,}5+6 \] \[ \mathrm{Me}\approx 25{,}5 \] Respuesta correcta: B
- El intervalo mediano es el primero cuya frecuencia acumulada iguala o supera a \(\dfrac{n}{2}\).
Respuesta correcta: B - La interpretación correcta de la mediana es que aproximadamente la mitad de los datos queda por debajo y la otra mitad por encima.
Respuesta correcta: C - \(F_{anterior}\) es la frecuencia acumulada anterior al intervalo mediano.
Respuesta correcta: B
En datos agrupados, la mediana no se limita a ubicar un intervalo: también puede estimarse numéricamente mediante una fórmula. Para responder bien en PAES M1, debes distinguir entre encontrar el intervalo mediano e interpolar dentro de él para obtener la mediana aproximada.