Datos , tablas , medidas centrales
5. tablas de datos agrupados por intervalos
Confección de tablas de datos agrupados por intervalos [marca de clase, \(f\), \(F\), \(h\), \(H\), intervalos aparentes e intervalos reales] (PAES M1)
Objetivo de la clase: organizar datos cuantitativos en tablas agrupadas por intervalos, calcular marca de clase, frecuencia absoluta, frecuencia acumulada, frecuencia relativa y frecuencia relativa acumulada, distinguiendo además entre intervalos aparentes e intervalos reales.
Cuando la cantidad de datos es grande o los valores son muy variados, deja de ser práctico trabajar con cada dato por separado. En esos casos conviene agrupar los datos en intervalos, porque así se puede resumir la información y observar mejor cómo se distribuye.
En esta clase aprenderás a confeccionar una tabla de datos agrupados por intervalos, identificar sus elementos principales y distinguir entre intervalos aparentes e intervalos reales, algo muy importante cuando los datos provienen de mediciones.
- Intervalos de clase: grupos de valores, por ejemplo \(10{-}14\), \(15{-}19\), \(20{-}24\).
- Frecuencia absoluta \(f\): cantidad de datos que caen en cada intervalo.
- Frecuencia acumulada \(F\): suma progresiva de las frecuencias absolutas.
- Frecuencia relativa \(h\): proporción que representa cada intervalo respecto del total. \[ h=\dfrac{f}{n} \]
- Frecuencia relativa acumulada \(H\): suma progresiva de las frecuencias relativas.
- Marca de clase \(x_i\): punto medio del intervalo. \[ x_i=\dfrac{\text{límite inferior}+\text{límite superior}}{2} \]
Intervalo aparente: es el que se escribe directamente en la tabla, por ejemplo \(10{-}14\).
Intervalo real: es el que realmente cubre los valores cuando la variable fue registrada con una unidad determinada.
Por ejemplo, si los datos fueron anotados en números enteros, el intervalo aparente \(10{-}14\) tiene como intervalo real:
\[ 9{,}5 \le x < 14{,}5 \]
y el intervalo aparente \(15{-}19\) tiene como intervalo real:
\[ 14{,}5 \le x < 19{,}5 \]
Aunque los intervalos aparentes y los intervalos reales se escriben de manera distinta, ambos entregan la misma marca de clase, porque tienen el mismo punto medio.
Por ejemplo, para el intervalo aparente \(10{-}14\), su intervalo real es \(9{,}5 \le x < 14{,}5\).
Si calculamos la marca de clase con los extremos aparentes, obtenemos:
\[ \dfrac{10+14}{2}=12 \]
Y si la calculamos con los extremos reales, obtenemos:
\[ \dfrac{9{,}5+14{,}5}{2}=12 \]
Por lo tanto, la marca de clase es la misma en ambos casos.
Sin embargo, los intervalos reales serán muy útiles más adelante, especialmente cuando trabajemos con mayor precisión la media y la mediana en datos agrupados.
- Revisa el conjunto de datos y observa desde qué valor mínimo hasta qué valor máximo se extiende.
- Elige intervalos que cubran todo el rango de datos, sin superponerse.
- Cuenta cuántos datos caen en cada intervalo y completa \(f\).
- Calcula la marca de clase de cada intervalo.
- Obtén \(F\), \(h\) y \(H\).
- Verifica al final que la última frecuencia acumulada sea \(n\) y que la última frecuencia relativa acumulada sea \(1\) o \(100\%\).
Ejemplo 1: construcción de una tabla agrupada
Se registraron las edades de 20 personas:
\[ 12,\ 13,\ 15,\ 16,\ 17,\ 18,\ 19,\ 19,\ 20,\ 21,\ 22,\ 23,\ 24,\ 24,\ 25,\ 26,\ 27,\ 28,\ 29,\ 30 \]
Elegimos intervalos aparentes de amplitud 5:
\[ 10{-}14,\quad 15{-}19,\quad 20{-}24,\quad 25{-}29,\quad 30{-}34 \]
Luego escribimos sus intervalos reales, calculamos la marca de clase y contamos cuántos datos hay en cada intervalo.
| Intervalo aparente | Intervalo real | Marca de clase \(x_i\) | \(f\) | \(F\) | \(h\) | \(H\) |
|---|---|---|---|---|---|---|
| \(10{-}14\) | \(9{,}5 \le x < 14{,}5\) | 12 | 2 | 2 | \(\dfrac{2}{20}=0{,}1=10\%\) | \(0{,}1=10\%\) |
| \(15{-}19\) | \(14{,}5 \le x < 19{,}5\) | 17 | 6 | 8 | \(\dfrac{6}{20}=0{,}3=30\%\) | \(0{,}4=40\%\) |
| \(20{-}24\) | \(19{,}5 \le x < 24{,}5\) | 22 | 6 | 14 | \(\dfrac{6}{20}=0{,}3=30\%\) | \(0{,}7=70\%\) |
| \(25{-}29\) | \(24{,}5 \le x < 29{,}5\) | 27 | 5 | 19 | \(\dfrac{5}{20}=0{,}25=25\%\) | \(0{,}95=95\%\) |
| \(30{-}34\) | \(29{,}5 \le x < 34{,}5\) | 32 | 1 | 20 | \(\dfrac{1}{20}=0{,}05=5\%\) | \(1=100\%\) |
Interpretación: el 30% de los datos está entre 15 y 19 años, y el 70% está a lo más en el intervalo \(20{-}24\).
Ejemplo 2: misma marca de clase usando intervalos aparentes o reales
Consideremos el intervalo aparente \(20{-}24\). Su intervalo real es:
\[ 19{,}5 \le x < 24{,}5 \]
Si usamos el intervalo aparente, la marca de clase es:
\[ \dfrac{20+24}{2}=22 \]
Si usamos el intervalo real, la marca de clase es:
\[ \dfrac{19{,}5+24{,}5}{2}=22 \]
Conclusión: ambos intervalos entregan la misma marca de clase.
Por eso, al confeccionar la tabla, la marca de clase puede calcularse directamente desde el intervalo aparente. Sin embargo, los intervalos reales son útiles para interpretar con mayor precisión qué valores pertenecen realmente a cada clase.
Ejemplo 3: cálculo de marcas de clase
Considera los siguientes intervalos aparentes:
\[ 5{-}9,\quad 10{-}14,\quad 15{-}19,\quad 20{-}24 \]
Sus marcas de clase son:
- \[ \dfrac{5+9}{2}=7 \]
- \[ \dfrac{10+14}{2}=12 \]
- \[ \dfrac{15+19}{2}=17 \]
- \[ \dfrac{20+24}{2}=22 \]
Interpretación: la marca de clase representa el valor central de cada intervalo y se usará más adelante para estimar la media en datos agrupados.
Ejemplo 4: lectura de una tabla agrupada
Observa la siguiente tabla sobre tiempos de traslado de 25 estudiantes:
| Intervalo aparente | Intervalo real | Marca de clase | \(f\) | \(F\) | \(h\) | \(H\) |
|---|---|---|---|---|---|---|
| \(0{-}9\) | \(-0{,}5 \le x < 9{,}5\) | \(4{,}5\) | 4 | 4 | \(\dfrac{4}{25}=0{,}16=16\%\) | \(0{,}16=16\%\) |
| \(10{-}19\) | \(9{,}5 \le x < 19{,}5\) | \(14{,}5\) | 8 | 12 | \(\dfrac{8}{25}=0{,}32=32\%\) | \(0{,}48=48\%\) |
| \(20{-}29\) | \(19{,}5 \le x < 29{,}5\) | \(24{,}5\) | 7 | 19 | \(\dfrac{7}{25}=0{,}28=28\%\) | \(0{,}76=76\%\) |
| \(30{-}39\) | \(29{,}5 \le x < 39{,}5\) | \(34{,}5\) | 4 | 23 | \(\dfrac{4}{25}=0{,}16=16\%\) | \(0{,}92=92\%\) |
| \(40{-}49\) | \(39{,}5 \le x < 49{,}5\) | \(44{,}5\) | 2 | 25 | \(\dfrac{2}{25}=0{,}08=8\%\) | \(1=100\%\) |
De esta tabla se puede concluir que:
- El intervalo más frecuente es \(10{-}19\) minutos.
- El 48% tarda a lo más 19 minutos.
- El 76% tarda a lo más 29 minutos.
- La marca de clase del intervalo \(30{-}39\) es \(34{,}5\).
- Construir intervalos que se traslapan, por ejemplo \(10{-}15\) y \(15{-}20\), sin aclarar el criterio.
- Confundir marca de clase con amplitud del intervalo.
- Olvidar que la última frecuencia acumulada debe coincidir con el total de datos.
- Calcular mal la frecuencia relativa al no dividir por el total.
- Creer que intervalo aparente e intervalo real entregan distinta marca de clase.
Las tablas agrupadas por intervalos se usan para resumir edades, estaturas, pesos, tiempos, puntajes y otras variables cuantitativas. Son muy útiles cuando hay muchos datos y se necesita observar tendencias generales en vez de revisar cada valor por separado.
Ejercicios de práctica
- Calcula la marca de clase de los intervalos \(10{-}14\), \(15{-}19\) y \(20{-}24\).
- Escribe los intervalos reales correspondientes a los intervalos aparentes \(30{-}34\) y \(35{-}39\).
- En una tabla agrupada, un intervalo tiene frecuencia absoluta 6 y el total de datos es 24. Calcula su frecuencia relativa en fracción, decimal y porcentaje.
- Si las frecuencias absolutas de tres intervalos son \(4,\ 7,\ 9\), calcula las frecuencias acumuladas.
- Si las frecuencias relativas de cuatro intervalos son \(0{,}2,\ 0{,}35,\ 0{,}25,\ 0{,}2\), calcula las frecuencias relativas acumuladas.
- Completa la siguiente idea: la marca de clase del intervalo \(12{-}18\) es \( \underline{\hspace{1.5cm}} \).
- Construye una tabla con intervalos \(0{-}4\), \(5{-}9\), \(10{-}14\) si las frecuencias son \(3,\ 5,\ 2\). Agrega \(F\).
- En una tabla agrupada, la última frecuencia acumulada es 40. ¿Qué significa eso?
- En una distribución, la frecuencia relativa acumulada hasta el tercer intervalo es \(0{,}85\). ¿Qué porcentaje representa?
- Explica con tus palabras la diferencia entre intervalo aparente e intervalo real.
- Si el intervalo aparente es \(50{-}59\), ¿cuál es su marca de clase?
- Si una tabla tiene intervalos \(100{-}109\), \(110{-}119\), \(120{-}129\), escribe los intervalos reales correspondientes.
- \[ \dfrac{10+14}{2}=12,\qquad \dfrac{15+19}{2}=17,\qquad \dfrac{20+24}{2}=22 \]
- \[ 29{,}5 \le x < 34{,}5 \] y \[ 34{,}5 \le x < 39{,}5 \]
- \[ h=\dfrac{6}{24}=\dfrac{1}{4}=0{,}25=25\% \]
- Las frecuencias acumuladas son: \[ 4,\quad 11,\quad 20 \]
- Las frecuencias relativas acumuladas son: \[ 0{,}2,\quad 0{,}55,\quad 0{,}8,\quad 1 \]
- \[ \dfrac{12+18}{2}=15 \]
-
Intervalo \(f\) \(F\) \(0{-}4\) 3 3 \(5{-}9\) 5 8 \(10{-}14\) 2 10 - Significa que el total de datos de la distribución es 40.
- \[ 0{,}85=85\% \]
- El intervalo aparente es el que se escribe en la tabla, por ejemplo \(10{-}14\). El intervalo real ajusta los límites para representar correctamente mediciones continuas, por ejemplo \(9{,}5 \le x < 14{,}5\).
- \[ \dfrac{50+59}{2}=54{,}5 \]
- \[ 99{,}5 \le x < 109{,}5,\qquad 109{,}5 \le x < 119{,}5,\qquad 119{,}5 \le x < 129{,}5 \]
Cuando aparezca una tabla agrupada, revisa primero si te piden leer frecuencias, interpretar acumulados, calcular marcas de clase o distinguir entre intervalo aparente e intervalo real. Muchas veces el error no está en la cuenta, sino en no identificar qué representa cada columna.
Ejercicios tipo PAES
- La marca de clase del intervalo \(20{-}29\) es:
- \(24{,}5\)
- \(25\)
- \(9\)
- \(49\)
- Si un intervalo tiene frecuencia absoluta 8 y el total de datos es 40, su frecuencia relativa en porcentaje es:
- \(8\%\)
- \(25\%\)
- \(40\%\)
- \(20\%\)
- La última frecuencia acumulada de una tabla agrupada representa:
- la amplitud del último intervalo
- el total de datos
- la suma de las marcas de clase
- la frecuencia relativa mayor
- El intervalo real correspondiente al intervalo aparente \(15{-}19\), si los datos fueron registrados en enteros, es:
- \(15 \le x \le 19\)
- \(14{,}5 \le x < 19{,}5\)
- \(15{,}5 \le x < 19{,}5\)
- \(14 \le x < 20\)
- Si las frecuencias absolutas de tres intervalos son \(5,\ 7,\ 3\), entonces la frecuencia acumulada del segundo intervalo es:
- \(15\)
- \(10\)
- \(12\)
- \(7\)
- En una tabla agrupada, la frecuencia relativa acumulada hasta el cuarto intervalo es \(0{,}9\). Esto significa que:
- el 90% de los datos está exactamente en el cuarto intervalo
- el 9% de los datos está bajo el cuarto intervalo
- faltan 0,1 datos para completar el total
- el 90% de los datos está en ese intervalo o en los anteriores
- La marca de clase se calcula promediando los extremos del intervalo: \[ \dfrac{20+29}{2}=24{,}5 \] Respuesta correcta: A
- \[ h=\dfrac{8}{40}=0{,}2=20\% \] Respuesta correcta: D
- La frecuencia acumulada suma progresivamente las frecuencias absolutas. Por eso, la última debe coincidir con el total de datos.
Respuesta correcta: B - Al pasar de intervalo aparente a real en datos enteros, se resta \(0{,}5\) al límite inferior y se suma \(0{,}5\) al superior: \[ 14{,}5 \le x < 19{,}5 \] Respuesta correcta: B
- La frecuencia acumulada del segundo intervalo es: \[ 5+7=12 \] Respuesta correcta: C
- Una frecuencia relativa acumulada de \(0{,}9\) significa: \[ 0{,}9=90\% \] Entonces, el 90% de los datos está en ese intervalo o en los anteriores.
Respuesta correcta: D
En tablas agrupadas por intervalos, cada columna tiene un significado distinto. Para responder bien en PAES M1, debes distinguir entre contar datos, acumular frecuencias, expresar proporciones, calcular marcas de clase y reconocer que los intervalos aparentes y reales comparten el mismo punto medio, aunque describen la clase con distinto nivel de precisión.