Datos , tablas , medidas centrales

9. Comparación entre medidas centrales [datos sueltos vs agrupados, pérdida de información]

Comparación entre medidas centrales [datos sueltos vs agrupados, pérdida de información] (PAES M1)

Objetivo de la clase: comparar la media, la mediana y la moda en datos sueltos, en tablas de frecuencias simples y en datos agrupados por intervalos, reconociendo cómo cambia la precisión de las medidas cuando la información se resume.

Hasta ahora has aprendido a calcular media, mediana y moda en distintos formatos: datos sueltos, tablas de frecuencia simple y datos agrupados por intervalos. En esta clase el foco estará en comparar qué ocurre cuando una misma información se organiza de maneras distintas.

La idea central es importante: mientras más se resume la información, más fácil puede ser analizarla, pero también se pierde detalle. Por eso, en datos agrupados por intervalos, las medidas centrales suelen ser aproximadas.

🤓 Idea central

No es lo mismo trabajar con datos sueltos, con una tabla de frecuencias simple o con datos agrupados en intervalos. En los datos sueltos conservamos toda la información original. En una tabla simple seguimos teniendo exactitud, pero la información ya está resumida. En datos agrupados, en cambio, ganamos orden y rapidez de lectura, pero perdemos precisión, porque reemplazamos muchos datos por intervalos y marcas de clase.

⚠️ Importante

En los ejercicios con intervalos distinguiremos entre intervalo aparente e intervalo real. Por ejemplo, el intervalo aparente \(50{-}59\) corresponde al intervalo real \(49{,}5 \le x < 59{,}5\).

📐 Recordatorio mínimo de fórmulas

Media en tabla de frecuencias simple:

\[ \bar{x}=\frac{\sum x_i f_i}{\sum f_i} \]

Media en datos agrupados:

\[ \bar{x}\approx\frac{\sum f_i x_i}{\sum f_i} \]

Mediana en datos agrupados:

\[ Me \approx L_i+\left(\frac{\frac{N}{2}-F_{anterior}}{f_m}\right)a \]

Moda en datos agrupados:

\[ Mo \approx L_i+\left(\frac{d_1}{d_1+d_2}\right)a \]

💡 Qué debes mirar al comparar
  • Si el valor obtenido es exacto o aproximado.
  • Si la medida conserva bien el centro del conjunto.
  • Qué información se pierde al pasar de datos sueltos a intervalos.
  • Qué ventaja se gana al resumir muchos datos en una tabla.

Ejemplo guiado: misma información, distinto nivel de resumen

Considera los siguientes datos sueltos:

\[ 2,\ 3,\ 1,\ 4,\ 2,\ 5,\ 3,\ 2,\ 4,\ 1,\ 3,\ 2 \]

Si trabajamos con los datos sueltos:

  • podemos ordenarlos,
  • identificar exactamente el dato central,
  • y reconocer con precisión el valor más frecuente.

Ordenando:

\[ 1,\ 1,\ 2,\ 2,\ 2,\ 2,\ 3,\ 3,\ 3,\ 4,\ 4,\ 5 \]

Moda: \(2\)

Mediana: como hay 12 datos, se promedian el 6.° y el 7.°:

\[ Me=\frac{2+3}{2}=2{,}5 \]

Media:

\[ \bar{x}=\frac{2+3+1+4+2+5+3+2+4+1+3+2}{12}=\frac{32}{12}\approx 2{,}67 \]

Si ahora construimos una tabla de frecuencia simple, las medidas siguen siendo exactas, porque no hemos perdido los valores originales: solo los hemos resumido.

Si agrupamos en intervalos, por ejemplo \(1{-}2\), \(3{-}4\), \(5{-}6\), entonces ya no trabajamos con cada dato exacto, sino con grupos de datos. Ahí las medidas dejan de ser exactas y pasan a ser estimaciones.

Ejercicio 1: desde datos sueltos a tabla de frecuencias simple

En un curso se registró cuántos mensajes enviaron los estudiantes durante un día. Los resultados fueron:

\[ 2,\ 3,\ 1,\ 4,\ 2,\ 5,\ 3,\ 2,\ 4,\ 1,\ 3,\ 2,\ 6,\ 4,\ 3,\ 2,\ 5,\ 3,\ 4,\ 2,\ 1,\ 3,\ 2,\ 4,\ 3 \]

Desarrolla lo siguiente:

  1. Ordena los datos.
  2. Construye una tabla de frecuencias con los datos dados.
  3. Calcula la media.
  4. Determina la moda.
  5. Determina la mediana usando la frecuencia acumulada.
  6. Compara las medidas obtenidas desde los datos sueltos y desde la tabla. ¿Cambian o no cambian?
Número de mensajes \(x_i\) Frecuencia \(f_i\) \(x_i \cdot f_i\) Frecuencia acumulada
1      
2      
3      
4      
5      
6      
Total      

Luego responde:

  1. ¿Cuál es el valor que más se repite?
  2. ¿Cuál es el dato central del conjunto?
  3. ¿Qué información aporta la frecuencia acumulada para hallar la mediana?
  4. ¿Se perdió información al pasar de los datos sueltos a la tabla simple?

Ejercicio 2: agrupar los mismos datos y comparar las medidas

Usa los mismos datos del ejercicio anterior, pero ahora agrúpalos en los siguientes intervalos:

\[ 1{-}2,\qquad 3{-}4,\qquad 5{-}6 \]

Desarrolla lo siguiente:

  1. Completa la tabla de frecuencias agrupadas.
  2. Escribe los intervalos reales.
  3. Calcula la marca de clase de cada intervalo.
  4. Calcula la media agrupada.
  5. Determina la mediana agrupada.
  6. Determina la moda agrupada.
  7. Compara estos resultados con los obtenidos en el ejercicio 1.
Intervalo aparente Intervalo real Marca de clase \(x_i\) Frecuencia \(f_i\) \(f_i \cdot x_i\) Frecuencia acumulada
\(1{-}2\)          
\(3{-}4\)          
\(5{-}6\)          
Total          

Luego responde:

  1. ¿Cuál es la clase modal?
  2. ¿Cuál es la clase mediana?
  3. ¿La media agrupada coincide exactamente con la media de los datos sueltos?
  4. ¿Qué información se perdió al agrupar?
  5. ¿Qué ocurrió con la moda al pasar de datos sueltos a datos agrupados?
⚠️ Observación importante

Al agrupar datos, la interpretación de la moda puede cambiar bastante. En este caso, los datos sueltos son bimodales, pero al agrupar se obtiene una única clase modal. Esto muestra que agrupar facilita el análisis, pero puede ocultar detalles importantes del conjunto original.

Ejercicio 3: segundo caso de datos agrupados

Los siguientes puntajes corresponden a 24 estudiantes en una prueba:

\[ 52,\ 64,\ 66,\ 68,\ 69,\ 70,\ 72,\ 72,\ 73,\ 74,\ 75,\ 75,\ 76,\ 77,\ 78,\ 78,\ 79,\ 80,\ 82,\ 84,\ 85,\ 88,\ 90,\ 92 \]

Desarrolla lo siguiente:

  1. Agrupa los datos en los intervalos dados.
  2. Completa la columna de intervalo real.
  3. Calcula la marca de clase de cada intervalo.
  4. Completa la frecuencia, el producto \(f_i \cdot x_i\) y la frecuencia acumulada.
  5. Calcula la media agrupada.
  6. Determina la mediana agrupada.
  7. Determina la moda agrupada.
  8. Explica por qué estas tres medidas son aproximadas.
Intervalo aparente Intervalo real Marca de clase \(x_i\) Frecuencia \(f_i\) \(f_i \cdot x_i\) Frecuencia acumulada
50–59          
60–69          
70–79          
80–89          
90–99          
Total          

Luego responde:

  1. ¿Cuál es la clase mediana?
  2. ¿Cuál es la clase modal?
  3. ¿Qué diferencia observas entre intervalo aparente e intervalo real?
  4. ¿Por qué la media agrupada no coincide necesariamente con la media real de los datos?
🌍 ¿Qué enseña esta comparación?

En estudios reales, muchas veces no se trabaja con los datos exactos, sino con tablas resumidas o con intervalos. Eso permite analizar grandes cantidades de información, pero obliga a aceptar que algunas medidas ya no son exactas. Comprender esa diferencia es clave para interpretar bien promedios, medianas y modas en contextos reales.

Cierre y reflexión

  1. ¿Qué diferencia hay entre trabajar con datos sueltos, una tabla de frecuencias simple y una tabla agrupada en intervalos?
  2. ¿En cuál de esas tres formas se conserva mejor la información original?
  3. ¿En cuál de esas tres formas es más exacto el cálculo de la media, la moda y la mediana?
  4. ¿Por qué se dice que en datos agrupados las medidas son aproximadas?
  5. ¿Qué ventaja tiene, a pesar de eso, trabajar con datos agrupados cuando hay muchos valores?