Datos , tablas , medidas centrales
8. Moda en datos agrupados
Moda en datos agrupados [clase modal, fórmula, estimación] (PAES M1)
Objetivo de la clase: identificar la clase modal en una tabla de datos agrupados, estimar la moda mediante una fórmula e interpretar su significado dentro de una distribución.
Cuando los datos están agrupados por intervalos, ya no podemos ver con exactitud cuál es el valor que más se repite. En ese caso, primero identificamos la clase modal, es decir, el intervalo con mayor frecuencia, y luego estimamos la moda usando una fórmula.
En esta clase aprenderás a reconocer la clase modal, a aplicar la fórmula de la moda en datos agrupados y a interpretar el resultado como una estimación del valor más representativo en la zona de mayor concentración de datos.
La moda es el valor que aparece con mayor frecuencia. En datos agrupados, como no conocemos los datos exactos uno a uno, no siempre podemos hallar la moda exacta, pero sí podemos identificar la clase modal y estimar un valor modal dentro de ella.
- Observa la columna de frecuencia absoluta \(f\).
- Busca el intervalo con mayor frecuencia.
- Ese intervalo se llama clase modal.
Una vez identificada la clase modal, la moda se estima con:
\[ \mathrm{Mo}\approx L_i+\left(\dfrac{d_1}{d_1+d_2}\right)\cdot a \]
donde:
- \(L_i\): límite inferior real de la clase modal,
- \(a\): amplitud del intervalo modal,
- \(d_1=f_m-f_{anterior}\): diferencia entre la frecuencia modal y la frecuencia anterior,
- \(d_2=f_m-f_{siguiente}\): diferencia entre la frecuencia modal y la frecuencia siguiente,
- \(f_m\): frecuencia de la clase modal.
Porque la tabla no muestra exactamente cómo se distribuyen los datos dentro de la clase modal. La fórmula usa las frecuencias vecinas para estimar en qué parte del intervalo se concentra más fuertemente la distribución.
- Encuentra la clase modal mirando la frecuencia mayor.
- Identifica \(L_i\) y la amplitud \(a\).
- Calcula \(d_1\) y \(d_2\) comparando la frecuencia modal con la anterior y la siguiente.
- Reemplaza con cuidado en la fórmula.
- Interpreta el resultado como una aproximación del valor más frecuente.
Ejemplo 1: identificar la clase modal
La siguiente tabla resume los tiempos de práctica, en minutos, de 30 estudiantes:
| Intervalo aparente | Intervalo real | \(f\) |
|---|---|---|
| \(0{-}9\) | \(-0{,}5 \le x < 9{,}5\) | 4 |
| \(10{-}19\) | \(9{,}5 \le x < 19{,}5\) | 7 |
| \(20{-}29\) | \(19{,}5 \le x < 29{,}5\) | 10 |
| \(30{-}39\) | \(29{,}5 \le x < 39{,}5\) | 6 |
| \(40{-}49\) | \(39{,}5 \le x < 49{,}5\) | 3 |
La frecuencia mayor es \(10\), que corresponde al intervalo \(20{-}29\).
Conclusión: la clase modal es \(20{-}29\).
Ejemplo 2: cálculo de la moda agrupada
Usamos la tabla anterior.
La clase modal es \(20{-}29\), cuyo intervalo real es:
\[ 19{,}5 \le x < 29{,}5 \]
Entonces:
- \(L_i=19{,}5\)
- \(a=10\)
- \(f_m=10\)
- \(f_{anterior}=7\)
- \(f_{siguiente}=6\)
Calculamos las diferencias:
\[ d_1=10-7=3 \]
\[ d_2=10-6=4 \]
Ahora reemplazamos en la fórmula:
\[ \mathrm{Mo}\approx 19{,}5+\left(\dfrac{3}{3+4}\right)\cdot 10 \]
\[ \mathrm{Mo}\approx 19{,}5+\left(\dfrac{3}{7}\right)\cdot 10 \]
\[ \mathrm{Mo}\approx 19{,}5+4{,}29 \]
\[ \mathrm{Mo}\approx 23{,}79 \]
Conclusión: la moda estimada es aproximadamente \(23{,}79\) minutos.
Ejemplo 3: interpretación de la moda agrupada
El valor \(\mathrm{Mo}\approx 23{,}79\) indica que el punto de mayor concentración de datos está aproximadamente cerca de \(23{,}79\) minutos.
Eso no significa que ese valor aparezca exactamente en la tabla original, sino que representa una estimación del valor más frecuente dentro de la zona modal.
Ejemplo 4: otro cálculo completo
Observa la siguiente tabla de estaturas de 40 estudiantes:
| Intervalo aparente | Intervalo real | \(f\) |
|---|---|---|
| \(140{-}149\) | \(139{,}5 \le x < 149{,}5\) | 5 |
| \(150{-}159\) | \(149{,}5 \le x < 159{,}5\) | 11 |
| \(160{-}169\) | \(159{,}5 \le x < 169{,}5\) | 14 |
| \(170{-}179\) | \(169{,}5 \le x < 179{,}5\) | 7 |
| \(180{-}189\) | \(179{,}5 \le x < 189{,}5\) | 3 |
La mayor frecuencia es \(14\), así que la clase modal es \(160{-}169\).
Identificamos los datos:
- \(L_i=159{,}5\)
- \(a=10\)
- \(f_m=14\)
- \(f_{anterior}=11\)
- \(f_{siguiente}=7\)
Calculamos:
\[ d_1=14-11=3 \]
\[ d_2=14-7=7 \]
Aplicamos la fórmula:
\[ \mathrm{Mo}\approx 159{,}5+\left(\dfrac{3}{3+7}\right)\cdot 10 \]
\[ \mathrm{Mo}\approx 159{,}5+3 \]
\[ \mathrm{Mo}\approx 162{,}5 \]
Interpretación: la estatura modal estimada es aproximadamente \(162{,}5\) cm.
Ejemplo 5: comparación entre clase modal y moda estimada
La clase modal solo indica en qué intervalo está la mayor concentración de datos.
La moda estimada, en cambio, intenta ubicar un valor específico dentro de ese intervalo.
| Concepto | Qué indica |
|---|---|
| Clase modal | El intervalo con mayor frecuencia |
| Moda estimada | Un valor aproximado de máxima concentración dentro de ese intervalo |
- Confundir la clase modal con el intervalo mediano.
- Usar el límite inferior aparente en vez del límite inferior real.
- Calcular mal \(d_1\) y \(d_2\).
- Creer que la moda estimada es exacta.
- Olvidar que la clase modal debe compararse con la frecuencia anterior y con la siguiente.
La moda agrupada ayuda a identificar la zona donde los datos se concentran con mayor fuerza. Esto es útil en contextos como tallas, edades, tiempos o puntajes, cuando interesa reconocer el tramo más frecuente de la distribución y estimar un valor representativo dentro de él.
En datos sueltos, la moda es el valor que más se repite. En datos agrupados, esa idea se transforma en dos pasos: primero se localiza la clase modal y luego se estima la moda usando las frecuencias vecinas para ubicar mejor el punto de máxima concentración.
Ejercicios de práctica
- Explica qué es la clase modal en una tabla de datos agrupados.
- En una tabla, las frecuencias son \(4,\ 9,\ 12,\ 7,\ 3\). ¿Cuál es la clase modal?
- Si una clase modal tiene \(f_m=15\), la frecuencia anterior es 11 y la siguiente es 9, calcula \(d_1\) y \(d_2\).
- En un intervalo modal con límite inferior real \(29{,}5\), amplitud 10, \(d_1=4\) y \(d_2=6\), calcula la moda estimada.
- Explica por qué la moda agrupada es una estimación y no un valor exacto.
- Si la clase modal es \(50{-}59\), su intervalo real es \(49{,}5 \le x < 59{,}5\), \(f_m=18\), \(f_{anterior}=12\) y \(f_{siguiente}=10\), calcula la moda.
- ¿Qué diferencia hay entre clase modal y moda estimada?
- En una tabla agrupada, si la frecuencia anterior y la siguiente a la clase modal son iguales, ¿qué ocurre con la fracción \(\dfrac{d_1}{d_1+d_2}\)?
- Si \(L_i=19{,}5\), \(a=10\), \(f_m=14\), \(f_{anterior}=10\), \(f_{siguiente}=12\), calcula la moda estimada.
- Interpreta una moda agrupada aproximada de \(72{,}4\).
- En una tabla, ¿por qué no basta con saber solo la frecuencia modal para calcular la moda agrupada?
- ¿Qué papel cumplen las frecuencias vecinas en la fórmula de la moda agrupada?
- Es el intervalo que tiene la mayor frecuencia absoluta dentro de la tabla.
- La clase modal es la tercera clase, porque tiene frecuencia \(12\), que es la mayor.
- \[ d_1=15-11=4,\qquad d_2=15-9=6 \]
- \[ \mathrm{Mo}\approx 29{,}5+\left(\dfrac{4}{4+6}\right)\cdot 10 \] \[ \mathrm{Mo}\approx 29{,}5+4 \] \[ \mathrm{Mo}\approx 33{,}5 \]
- Porque dentro del intervalo modal no conocemos la distribución exacta de los datos. La fórmula solo estima dónde está la mayor concentración.
- \[ d_1=18-12=6,\qquad d_2=18-10=8 \] \[ \mathrm{Mo}\approx 49{,}5+\left(\dfrac{6}{6+8}\right)\cdot 10 \] \[ \mathrm{Mo}\approx 49{,}5+\left(\dfrac{6}{14}\right)\cdot 10 \] \[ \mathrm{Mo}\approx 49{,}5+4{,}29 \] \[ \mathrm{Mo}\approx 53{,}79 \]
- La clase modal es el intervalo con mayor frecuencia. La moda estimada es un valor aproximado dentro de ese intervalo.
- Si son iguales, entonces \(d_1=d_2\) y la fracción vale \(\dfrac{1}{2}\), por lo que la moda queda en el centro del intervalo modal.
- \[ d_1=14-10=4,\qquad d_2=14-12=2 \] \[ \mathrm{Mo}\approx 19{,}5+\left(\dfrac{4}{4+2}\right)\cdot 10 \] \[ \mathrm{Mo}\approx 19{,}5+\dfrac{4}{6}\cdot 10 \] \[ \mathrm{Mo}\approx 19{,}5+6{,}67 \] \[ \mathrm{Mo}\approx 26{,}17 \]
- Significa que la zona de mayor concentración de datos está alrededor de \(72{,}4\), por lo que ese valor representa aproximadamente el dato más frecuente de la distribución.
- Porque la fórmula necesita comparar la clase modal con las frecuencias vecinas para estimar en qué parte del intervalo está la mayor concentración.
- Permiten medir hacia qué lado del intervalo modal se concentra más la distribución y, con eso, ajustar la estimación de la moda.
En ejercicios de moda agrupada, separa el proceso en tres partes: primero identifica la clase modal, después calcula bien \(d_1\) y \(d_2\), y recién entonces reemplaza en la fórmula.
Ejercicios tipo PAES
- En una tabla agrupada, la clase modal es:
- la que contiene la mediana
- la que tiene mayor amplitud
- la que tiene mayor frecuencia
- la última clase de la tabla
- En la fórmula de la moda agrupada, \(d_1\) representa:
- la diferencia entre la frecuencia modal y la frecuencia anterior
- la suma de las dos frecuencias vecinas
- la amplitud del intervalo modal
- la marca de clase modal
- Si \(L_i=39{,}5\), \(a=10\), \(f_m=18\), \(f_{anterior}=14\) y \(f_{siguiente}=12\), la moda estimada es:
- \(43{,}5\)
- \(45{,}5\)
- \(44{,}5\)
- \(46{,}17\)
- La moda en datos agrupados se considera una estimación porque:
- la frecuencia siempre es decimal
- se desconoce la distribución exacta de los datos dentro del intervalo modal
- la clase modal coincide siempre con la mediana
- no existe límite inferior real
- Si en una tabla agrupada la clase modal tiene frecuencias vecinas iguales, entonces la moda estimada queda:
- al inicio del intervalo modal
- en el centro del intervalo modal
- fuera del intervalo modal
- en el límite superior real del intervalo siguiente
- En la fórmula de la moda agrupada, el valor \(a\) representa:
- la frecuencia acumulada anterior
- la amplitud del intervalo modal
- la suma de frecuencias
- la cantidad total de clases
- La clase modal es la que tiene mayor frecuencia.
Respuesta correcta: C - \(d_1\) es la diferencia entre la frecuencia modal y la frecuencia anterior.
Respuesta correcta: A - \[ d_1=18-14=4,\qquad d_2=18-12=6 \] \[ \mathrm{Mo}\approx 39{,}5+\left(\dfrac{4}{4+6}\right)\cdot 10 \] \[ \mathrm{Mo}\approx 39{,}5+4 \] \[ \mathrm{Mo}\approx 43{,}5 \] Respuesta correcta: A
- La moda es una estimación porque no conocemos cómo se distribuyen exactamente los datos dentro del intervalo modal.
Respuesta correcta: B - Si las frecuencias vecinas son iguales, entonces \(d_1=d_2\), por lo que la moda queda en el centro del intervalo modal.
Respuesta correcta: B - En la fórmula, \(a\) representa la amplitud del intervalo modal.
Respuesta correcta: B
En datos agrupados, la moda no se limita a ubicar la clase de mayor frecuencia. También puede estimarse numéricamente usando una fórmula que considera la clase modal y sus frecuencias vecinas. Para responder bien en PAES M1, debes distinguir entre reconocer la clase modal e interpretar la moda estimada como una aproximación del valor más frecuente.
