Datos , tablas , medidas centrales
9. Comparación entre medidas centrales [datos sueltos vs agrupados, pérdida de información]
Comparación entre medidas centrales [datos sueltos vs agrupados, pérdida de información] (PAES M1)
Objetivo de la clase: comparar la media, la mediana y la moda en datos sueltos, en tablas de frecuencias simples y en datos agrupados por intervalos, reconociendo cómo cambia la precisión de las medidas cuando la información se resume.
Hasta ahora has aprendido a calcular media, mediana y moda en distintos formatos: datos sueltos, tablas de frecuencia simple y datos agrupados por intervalos. En esta clase el foco estará en comparar qué ocurre cuando una misma información se organiza de maneras distintas.
La idea central es importante: mientras más se resume la información, más fácil puede ser analizarla, pero también se pierde detalle. Por eso, en datos agrupados por intervalos, las medidas centrales suelen ser aproximadas.
No es lo mismo trabajar con datos sueltos, con una tabla de frecuencias simple o con datos agrupados en intervalos. En los datos sueltos conservamos toda la información original. En una tabla simple seguimos teniendo exactitud, pero la información ya está resumida. En datos agrupados, en cambio, ganamos orden y rapidez de lectura, pero perdemos precisión, porque reemplazamos muchos datos por intervalos y marcas de clase.
En los ejercicios con intervalos distinguiremos entre intervalo aparente e intervalo real. Por ejemplo, el intervalo aparente \(50{-}59\) corresponde al intervalo real \(49{,}5 \le x < 59{,}5\).
Media en tabla de frecuencias simple:
\[ \bar{x}=\frac{\sum x_i f_i}{\sum f_i} \]
Media en datos agrupados:
\[ \bar{x}\approx\frac{\sum f_i x_i}{\sum f_i} \]
Mediana en datos agrupados:
\[ Me \approx L_i+\left(\frac{\frac{N}{2}-F_{anterior}}{f_m}\right)a \]
Moda en datos agrupados:
\[ Mo \approx L_i+\left(\frac{d_1}{d_1+d_2}\right)a \]
- Si el valor obtenido es exacto o aproximado.
- Si la medida conserva bien el centro del conjunto.
- Qué información se pierde al pasar de datos sueltos a intervalos.
- Qué ventaja se gana al resumir muchos datos en una tabla.
Ejemplo guiado: misma información, distinto nivel de resumen
Considera los siguientes datos sueltos:
\[ 2,\ 3,\ 1,\ 4,\ 2,\ 5,\ 3,\ 2,\ 4,\ 1,\ 3,\ 2 \]
Si trabajamos con los datos sueltos:
- podemos ordenarlos,
- identificar exactamente el dato central,
- y reconocer con precisión el valor más frecuente.
Ordenando:
\[ 1,\ 1,\ 2,\ 2,\ 2,\ 2,\ 3,\ 3,\ 3,\ 4,\ 4,\ 5 \]
Moda: \(2\)
Mediana: como hay 12 datos, se promedian el 6.° y el 7.°:
\[ Me=\frac{2+3}{2}=2{,}5 \]
Media:
\[ \bar{x}=\frac{2+3+1+4+2+5+3+2+4+1+3+2}{12}=\frac{32}{12}\approx 2{,}67 \]
Si ahora construimos una tabla de frecuencia simple, las medidas siguen siendo exactas, porque no hemos perdido los valores originales: solo los hemos resumido.
Si agrupamos en intervalos, por ejemplo \(1{-}2\), \(3{-}4\), \(5{-}6\), entonces ya no trabajamos con cada dato exacto, sino con grupos de datos. Ahí las medidas dejan de ser exactas y pasan a ser estimaciones.
Ejercicio 1: desde datos sueltos a tabla de frecuencias simple
En un curso se registró cuántos mensajes enviaron los estudiantes durante un día. Los resultados fueron:
\[ 2,\ 3,\ 1,\ 4,\ 2,\ 5,\ 3,\ 2,\ 4,\ 1,\ 3,\ 2,\ 6,\ 4,\ 3,\ 2,\ 5,\ 3,\ 4,\ 2,\ 1,\ 3,\ 2,\ 4,\ 3 \]
Desarrolla lo siguiente:
- Ordena los datos.
- Construye una tabla de frecuencias con los datos dados.
- Calcula la media.
- Determina la moda.
- Determina la mediana usando la frecuencia acumulada.
- Compara las medidas obtenidas desde los datos sueltos y desde la tabla. ¿Cambian o no cambian?
| Número de mensajes \(x_i\) | Frecuencia \(f_i\) | \(x_i \cdot f_i\) | Frecuencia acumulada |
|---|---|---|---|
| 1 | |||
| 2 | |||
| 3 | |||
| 4 | |||
| 5 | |||
| 6 | |||
| Total |
Luego responde:
- ¿Cuál es el valor que más se repite?
- ¿Cuál es el dato central del conjunto?
- ¿Qué información aporta la frecuencia acumulada para hallar la mediana?
- ¿Se perdió información al pasar de los datos sueltos a la tabla simple?
- Datos ordenados:
\[ 1,\ 1,\ 1,\ 2,\ 2,\ 2,\ 2,\ 2,\ 2,\ 2,\ 3,\ 3,\ 3,\ 3,\ 3,\ 3,\ 3,\ 4,\ 4,\ 4,\ 4,\ 4,\ 5,\ 5,\ 6 \] - Tabla completa:
\(x_i\) \(f_i\) \(x_i \cdot f_i\) Frecuencia acumulada 1 3 3 3 2 7 14 10 3 7 21 17 4 5 20 22 5 2 10 24 6 1 6 25 Total 25 74 25 - Media: \[ \bar{x}=\frac{74}{25}=2{,}96 \]
- Moda: los valores de mayor frecuencia son \(2\) y \(3\), porque ambos aparecen 7 veces.
El conjunto es bimodal. - Mediana: como hay 25 datos, la posición central es: \[ \frac{25+1}{2}=13 \] La frecuencia acumulada llega a 10 en el valor 2 y a 17 en el valor 3, por lo tanto el dato 13 corresponde a \(3\).
\[ Me=3 \] - Las medidas obtenidas desde los datos sueltos y desde la tabla simple no cambian, porque la tabla simple solo resume la información exacta.
- Los valores que más se repiten son \(2\) y \(3\).
- El dato central es \(3\).
- La frecuencia acumulada permite ubicar la posición central sin tener que reescribir todos los datos ordenados.
- No se pierde información esencial, porque seguimos trabajando con los mismos valores exactos, solo más organizados.
Ejercicio 2: agrupar los mismos datos y comparar las medidas
Usa los mismos datos del ejercicio anterior, pero ahora agrúpalos en los siguientes intervalos:
\[ 1{-}2,\qquad 3{-}4,\qquad 5{-}6 \]
Desarrolla lo siguiente:
- Completa la tabla de frecuencias agrupadas.
- Escribe los intervalos reales.
- Calcula la marca de clase de cada intervalo.
- Calcula la media agrupada.
- Determina la mediana agrupada.
- Determina la moda agrupada.
- Compara estos resultados con los obtenidos en el ejercicio 1.
| Intervalo aparente | Intervalo real | Marca de clase \(x_i\) | Frecuencia \(f_i\) | \(f_i \cdot x_i\) | Frecuencia acumulada |
|---|---|---|---|---|---|
| \(1{-}2\) | |||||
| \(3{-}4\) | |||||
| \(5{-}6\) | |||||
| Total |
Luego responde:
- ¿Cuál es la clase modal?
- ¿Cuál es la clase mediana?
- ¿La media agrupada coincide exactamente con la media de los datos sueltos?
- ¿Qué información se perdió al agrupar?
- ¿Qué ocurrió con la moda al pasar de datos sueltos a datos agrupados?
- Tabla completa:
Intervalo aparente Intervalo real Marca de clase \(x_i\) \(f_i\) \(f_i\cdot x_i\) Frecuencia acumulada \(1{-}2\) \(0{,}5 \le x < 2{,}5\) \(1{,}5\) 10 15 10 \(3{-}4\) \(2{,}5 \le x < 4{,}5\) \(3{,}5\) 12 42 22 \(5{-}6\) \(4{,}5 \le x < 6{,}5\) \(5{,}5\) 3 16{,}5 25 Total 25 73{,}5 25 - Media agrupada: \[ \bar{x}\approx \frac{73{,}5}{25}=2{,}94 \]
- Mediana agrupada:
Como \(n=25\), \[ \frac{25}{2}=12{,}5 \] La clase mediana es \(3{-}4\), porque la frecuencia acumulada pasa de 10 a 22. \[ Me \approx 2{,}5+\left(\frac{12{,}5-10}{12}\right)\cdot 2 \] \[ Me \approx 2{,}5+\frac{2{,}5}{12}\cdot 2 \] \[ Me \approx 2{,}92 \] - Moda agrupada:
La clase modal es \(3{-}4\), porque tiene la mayor frecuencia: \(12\). \[ d_1=12-10=2,\qquad d_2=12-3=9 \] \[ Mo\approx 2{,}5+\left(\frac{2}{2+9}\right)\cdot 2 \] \[ Mo\approx 2{,}5+\frac{4}{11} \] \[ Mo\approx 2{,}86 \] - La clase modal es \(3{-}4\).
- La clase mediana es \(3{-}4\).
- No, la media agrupada no coincide exactamente: se aproxima a la media real.
- Se perdió el detalle exacto de cada dato individual. Ahora solo sabemos cuántos datos hay dentro de cada intervalo.
- En los datos sueltos la moda era bimodal (\(2\) y \(3\)). Al agrupar, esa información fina se pierde y aparece una sola clase modal, \(3{-}4\). Esta es una muestra clara de pérdida de información.
Al agrupar datos, la interpretación de la moda puede cambiar bastante. En este caso, los datos sueltos son bimodales, pero al agrupar se obtiene una única clase modal. Esto muestra que agrupar facilita el análisis, pero puede ocultar detalles importantes del conjunto original.
Ejercicio 3: segundo caso de datos agrupados
Los siguientes puntajes corresponden a 24 estudiantes en una prueba:
\[ 52,\ 64,\ 66,\ 68,\ 69,\ 70,\ 72,\ 72,\ 73,\ 74,\ 75,\ 75,\ 76,\ 77,\ 78,\ 78,\ 79,\ 80,\ 82,\ 84,\ 85,\ 88,\ 90,\ 92 \]
Desarrolla lo siguiente:
- Agrupa los datos en los intervalos dados.
- Completa la columna de intervalo real.
- Calcula la marca de clase de cada intervalo.
- Completa la frecuencia, el producto \(f_i \cdot x_i\) y la frecuencia acumulada.
- Calcula la media agrupada.
- Determina la mediana agrupada.
- Determina la moda agrupada.
- Explica por qué estas tres medidas son aproximadas.
| Intervalo aparente | Intervalo real | Marca de clase \(x_i\) | Frecuencia \(f_i\) | \(f_i \cdot x_i\) | Frecuencia acumulada |
|---|---|---|---|---|---|
| 50–59 | |||||
| 60–69 | |||||
| 70–79 | |||||
| 80–89 | |||||
| 90–99 | |||||
| Total |
Luego responde:
- ¿Cuál es la clase mediana?
- ¿Cuál es la clase modal?
- ¿Qué diferencia observas entre intervalo aparente e intervalo real?
- ¿Por qué la media agrupada no coincide necesariamente con la media real de los datos?
- Tabla completa:
Intervalo aparente Intervalo real Marca de clase \(x_i\) \(f_i\) \(f_i\cdot x_i\) Frecuencia acumulada 50–59 \(49{,}5 \le x < 59{,}5\) \(54{,}5\) 1 54{,}5 1 60–69 \(59{,}5 \le x < 69{,}5\) \(64{,}5\) 4 258 5 70–79 \(69{,}5 \le x < 79{,}5\) \(74{,}5\) 12 894 17 80–89 \(79{,}5 \le x < 89{,}5\) \(84{,}5\) 5 422{,}5 22 90–99 \(89{,}5 \le x < 99{,}5\) \(94{,}5\) 2 189 24 Total 24 1818 24 - Media agrupada: \[ \bar{x}\approx \frac{1818}{24}=75{,}75 \]
- Mediana agrupada:
\[ \frac{24}{2}=12 \] La clase mediana es \(70{-}79\), porque la frecuencia acumulada pasa de 5 a 17. \[ Me\approx 69{,}5+\left(\frac{12-5}{12}\right)\cdot 10 \] \[ Me\approx 69{,}5+5{,}83 \] \[ Me\approx 75{,}33 \] - Moda agrupada:
La clase modal es \(70{-}79\), porque tiene frecuencia 12. \[ d_1=12-4,\qquad d_2=12-5 \] \[ d_1=8,\qquad d_2=7 \] \[ Mo\approx 69{,}5+\left(\frac{8}{8+7}\right)\cdot 10 \] \[ Mo\approx 69{,}5+5{,}33 \] \[ Mo\approx 74{,}83 \] - La clase mediana es \(70{-}79\).
- La clase modal es \(70{-}79\).
- El intervalo aparente es el que se escribe en la tabla, mientras que el real ajusta los límites para representar correctamente la continuidad de los datos.
- Porque la media agrupada usa marcas de clase en lugar de los valores exactos originales.
En estudios reales, muchas veces no se trabaja con los datos exactos, sino con tablas resumidas o con intervalos. Eso permite analizar grandes cantidades de información, pero obliga a aceptar que algunas medidas ya no son exactas. Comprender esa diferencia es clave para interpretar bien promedios, medianas y modas en contextos reales.
Cierre y reflexión
- ¿Qué diferencia hay entre trabajar con datos sueltos, una tabla de frecuencias simple y una tabla agrupada en intervalos?
- ¿En cuál de esas tres formas se conserva mejor la información original?
- ¿En cuál de esas tres formas es más exacto el cálculo de la media, la moda y la mediana?
- ¿Por qué se dice que en datos agrupados las medidas son aproximadas?
- ¿Qué ventaja tiene, a pesar de eso, trabajar con datos agrupados cuando hay muchos valores?
- En los datos sueltos se conserva toda la información exacta. En la tabla simple la información se resume, pero sigue siendo exacta. En los datos agrupados se organiza más, pero se pierde detalle al trabajar con intervalos.
- En los datos sueltos.
- En los datos sueltos y en la tabla de frecuencias simple, porque ambos conservan la exactitud de los valores.
- Porque ya no se trabaja con cada dato exacto, sino con intervalos y marcas de clase, lo que obliga a estimar.
- Permite resumir y analizar grandes conjuntos de datos de manera más rápida y ordenada.