Datos , tablas , medidas centrales
| Sitio: | MATEMÁTICAS × Profe Arauco |
| Curso: | Probabilidades y Estadística Descriptiva e Inferencial |
| Libro: | Datos , tablas , medidas centrales |
| Imprimido por: | Invitado |
| Día: | domingo, 26 de abril de 2026, 09:49 |
Tabla de contenidos
- 1. Media aritmética en datos sueltos [cálculo, interpretación, limitaciones] (PAES M1)
- 2. Mediana y moda en datos sueltos [comparación entre medidas centrales] (PAES M1)
- 3. Tablas de frecuencia simple
- 4. Media, moda y mediana en tablas simples de frecuencias (PAES M1)
- 5. tablas de datos agrupados por intervalos
- 6. Media en datos agrupados
- 7. Mediana en datos agrupados
- 8. Moda en datos agrupados
- 9. Comparación entre medidas centrales [datos sueltos vs agrupados, pérdida de información]
- 10. Sesgo y valores extremos [cuándo la media representa bien y cuándo no] (PAES M1)
- 11. Interpretación en contexto y decisión según situación [medidas centrales] (PAES M1)
1. Media aritmética en datos sueltos [cálculo, interpretación, limitaciones] (PAES M1)
Media aritmética en datos sueltos [cálculo, interpretación, limitaciones] (PAES M1)
Objetivo de la clase: calcular la media aritmética en conjuntos pequeños de datos, interpretarla en contexto y reconocer sus principales limitaciones, especialmente cuando existen valores extremos.
La media aritmética es una de las medidas de tendencia central más conocidas. Se usa para resumir un conjunto de datos mediante un solo valor, pero no siempre representa de la mejor manera lo que ocurre en el grupo. En esta página aprenderás a calcularla, a interpretarla y a decidir cuándo conviene usarla con cuidado.
Si un conjunto de datos está formado por \(n\) valores \(x_1, x_2, x_3, \dots, x_n\), su media aritmética se calcula con la fórmula:
\[ \bar{x}=\dfrac{x_1+x_2+x_3+\cdots+x_n}{n} \]
Idea clave: se suman todos los datos y luego se divide por la cantidad total de datos.
- Identifica todos los datos del conjunto.
- Cuenta cuántos datos hay.
- Suma sus valores.
- Divide por la cantidad total de datos.
- Interpreta el resultado en el contexto del problema.
La media no tiene por qué ser uno de los datos del conjunto. Su función es resumir el comportamiento global del grupo. Por eso, en algunos contextos puede aparecer un valor decimal aunque los datos originales sean enteros.
Ejemplo 1: cálculo directo de la media
Las edades de 5 estudiantes que participan en un taller son:
\[ 14,\ 15,\ 13,\ 16,\ 17 \]
Paso 1: sumar los datos.
\[ 14+15+13+16+17=75 \]
Paso 2: dividir por la cantidad de datos.
Como hay 5 estudiantes:
\[ \bar{x}=\dfrac{75}{5}=15 \]
Interpretación: la edad promedio del grupo es 15 años.
Ejemplo 2: la media no siempre coincide con un dato
Las cantidades de goles anotados por un equipo en 4 partidos fueron:
\[ 1,\ 2,\ 2,\ 5 \]
Cálculo:
\[ \bar{x}=\dfrac{1+2+2+5}{4}=\dfrac{10}{4}=2{,}5 \]
Interpretación: el equipo anotó en promedio \(2{,}5\) goles por partido.
Aunque en ningún partido anotó exactamente \(2{,}5\) goles, la media sirve para resumir el rendimiento general.
Ejemplo 3: lectura de tabla y cálculo de media
La siguiente tabla muestra la cantidad de vasos de agua consumidos por una estudiante durante 5 días:
| Día | Vasos de agua |
|---|---|
| Lunes | 6 |
| Martes | 8 |
| Miércoles | 7 |
| Jueves | 5 |
| Viernes | 9 |
Cálculo de la media:
\[ \bar{x}=\dfrac{6+8+7+5+9}{5}=\dfrac{35}{5}=7 \]
Interpretación: en promedio, consumió 7 vasos de agua por día.
- Dividir por la cantidad de valores distintos en lugar de dividir por la cantidad total de datos.
- Olvidar incluir alguno de los datos en la suma.
- Confundir media con mediana o con moda.
- Dar una interpretación fuera de contexto, como si la media fuera siempre un valor real observado.
Ejemplo 4: limitación de la media ante un valor extremo
Supongamos que 5 estudiantes leyeron esta cantidad de libros en un mes:
\[ 2,\ 2,\ 3,\ 3,\ 15 \]
Cálculo de la media:
\[ \bar{x}=\dfrac{2+2+3+3+15}{5}=\dfrac{25}{5}=5 \]
Sin embargo, la mayoría de los estudiantes leyó entre 2 y 3 libros. El dato 15 es un valor extremo y empuja la media hacia arriba.
Conclusión: la media es útil, pero puede dejar de representar bien al grupo cuando aparece un valor muy alejado de los demás.
La media se usa para resumir notas, temperaturas, tiempos, puntajes, ingresos, ventas y resultados de encuestas. Sin embargo, en algunos contextos —como salarios o precios— un valor extremo puede alterar bastante el promedio, por lo que no siempre basta con mirar solo la media para describir la situación.
En preguntas tipo PAES no solo pueden pedirte calcular la media. También pueden pedirte decidir si la media representa bien o no a un conjunto, comparar dos grupos con el mismo promedio o interpretar cómo cambia la media cuando se agrega o se quita un dato.
Ejercicios de práctica
- Calcula la media aritmética de \(4,\ 6,\ 8,\ 10,\ 12\).
- Calcula la media de \(3,\ 5,\ 7,\ 9\).
- Las notas de un estudiante son \(5{,}0,\ 6{,}0,\ 4{,}5,\ 5{,}5\). Calcula la media.
- La cantidad de mensajes recibidos por día en una semana fue \(8,\ 6,\ 7,\ 9,\ 5\). Calcula la media.
- En una tabla aparecen las edades \(12,\ 13,\ 13,\ 14,\ 18\). Calcula la media e interpreta el resultado.
- Un deportista recorrió \(3,\ 5,\ 4,\ 6,\ 7\) kilómetros en 5 días. ¿Cuál fue su distancia media diaria?
- Un conjunto de datos es \(2,\ 2,\ 2,\ 2,\ 12\). Calcula la media y comenta si representa bien al grupo.
- Construye un conjunto de 4 datos cuya media sea 10.
- Si la media de 5 números es 8, ¿cuál es la suma total de esos 5 números?
- La media de \(6,\ 8,\ x\) es 10. Determina el valor de \(x\).
- Si a los datos \(4,\ 6,\ 8,\ 10\) se agrega el valor 12, ¿cuál es la nueva media?
- Explica con tus palabras una limitación de la media aritmética.
- \[ \bar{x}=\dfrac{4+6+8+10+12}{5}=\dfrac{40}{5}=8 \]
- \[ \bar{x}=\dfrac{3+5+7+9}{4}=\dfrac{24}{4}=6 \]
- \[ \bar{x}=\dfrac{5{,}0+6{,}0+4{,}5+5{,}5}{4}=\dfrac{21}{4}=5{,}25 \]
- \[ \bar{x}=\dfrac{8+6+7+9+5}{5}=\dfrac{35}{5}=7 \]
- \[ \bar{x}=\dfrac{12+13+13+14+18}{5}=\dfrac{70}{5}=14 \] La edad promedio del grupo es 14 años.
- \[ \bar{x}=\dfrac{3+5+4+6+7}{5}=\dfrac{25}{5}=5 \] Recorrió en promedio 5 km por día.
- \[ \bar{x}=\dfrac{2+2+2+2+12}{5}=\dfrac{20}{5}=4 \] No representa muy bien al grupo, porque el 12 es un valor extremo respecto de los demás.
- Una posible respuesta es: \(8,\ 10,\ 10,\ 12\), porque \[ \dfrac{8+10+10+12}{4}=\dfrac{40}{4}=10 \]
- Si la media es 8 y hay 5 números, entonces la suma es: \[ 8\cdot 5=40 \]
- \[ \dfrac{6+8+x}{3}=10 \] \[ 14+x=30 \] \[ x=16 \]
- Suma original: \[ 4+6+8+10=28 \] Nueva suma: \[ 28+12=40 \] Como ahora hay 5 datos: \[ \bar{x}=\dfrac{40}{5}=8 \]
- Una limitación de la media es que puede verse muy afectada por valores extremos, por lo que a veces no representa bien al conjunto.
Cuando veas un promedio, no te quedes solo con el cálculo. Pregúntate también si ese valor realmente describe al grupo o si está siendo alterado por uno o dos datos muy alejados.
Ejercicios tipo PAES
- La media aritmética de los datos \(6,\ 8,\ 10,\ 12\) es:
- \(8\)
- \(10{,}5\)
- \(9\)
- \(11\)
- Un estudiante obtiene las notas \(4{,}0,\ 5{,}0,\ 6{,}0\) en tres pruebas. ¿Cuál es su media aritmética?
- \(5{,}0\)
- \(4{,}5\)
- \(5{,}5\)
- \(15\)
- La cantidad de minutos que 5 personas tardan en llegar al colegio es \(10,\ 12,\ 11,\ 9,\ 38\). ¿Cuál afirmación es correcta?
- La media representa muy bien al grupo porque usa todos los datos.
- La media necesariamente coincide con uno de los tiempos observados.
- La media no se puede calcular porque hay un valor muy alto.
- La media puede verse afectada por el valor 38, por lo que podría no representar bien al grupo.
- Si la media de 4 números es 7, entonces la suma de esos 4 números es:
- \(11\)
- \(28\)
- \(7\)
- \(21\)
- La media de los datos \(3,\ 5,\ 7,\ x\) es 6. El valor de \(x\) es:
- \(6\)
- \(8\)
- \(9\)
- \(11\)
- Se registran las ventas diarias de una tienda durante 5 días: \(20,\ 22,\ 21,\ 23,\ 24\). Si se agrega un sexto día con 40 ventas, ¿qué ocurre con la media?
- Aumenta.
- Disminuye.
- Permanece igual.
- No se puede determinar.
- \[ \bar{x}=\dfrac{6+8+10+12}{4}=\dfrac{36}{4}=9 \] Por lo tanto, la respuesta correcta es C.
- \[ \bar{x}=\dfrac{4{,}0+5{,}0+6{,}0}{3}=\dfrac{15}{3}=5{,}0 \] Por lo tanto, la respuesta correcta es A.
- El valor 38 es mucho mayor que los otros tiempos y puede arrastrar la media hacia arriba. Por eso, la media podría no representar bien al grupo.
Respuesta correcta: D. - Si la media de 4 números es 7, entonces: \[ \text{suma}=7\cdot 4=28 \] Por lo tanto, la respuesta correcta es B.
- \[ \dfrac{3+5+7+x}{4}=6 \] \[ 15+x=24 \] \[ x=9 \] Por lo tanto, la respuesta correcta es C.
- La suma de los primeros 5 días es: \[ 20+22+21+23+24=110 \] Su media era: \[ \dfrac{110}{5}=22 \] Al agregar el valor 40, la nueva suma es: \[ 110+40=150 \] y la nueva media: \[ \dfrac{150}{6}=25 \] Como \(25>22\), la media aumenta.
Respuesta correcta: A.
La media aritmética es muy útil para resumir información, pero no debe interpretarse de manera automática. En PAES M1 puede aparecer como cálculo directo, como interpretación de contexto o como análisis crítico frente a valores extremos.
2. Mediana y moda en datos sueltos [comparación entre medidas centrales] (PAES M1)
Mediana y moda en datos sueltos [comparación entre medidas centrales] (PAES M1)
Objetivo de la clase: identificar, calcular y comparar la mediana y la moda en conjuntos pequeños de datos, interpretando cuál de estas medidas centrales resulta más útil según el contexto.
Cuando analizamos un conjunto de datos, no siempre basta con calcular un promedio. A veces interesa conocer el valor que queda al centro del grupo y, en otras ocasiones, el valor que aparece con mayor frecuencia. Para eso usamos la mediana y la moda.
En esta clase aprenderás a calcular ambas medidas en datos sueltos, a compararlas y a decidir cuál entrega información más útil en distintas situaciones, tal como puede ocurrir en preguntas de PAES M1.
- Mediana: es el valor central de un conjunto de datos una vez ordenado.
- Si la cantidad de datos es impar, la mediana es el dato que queda justo al centro.
- Si la cantidad de datos es par, la mediana es el promedio de los dos datos centrales.
- Moda: es el dato que más se repite.
- Un conjunto puede ser amodal (sin moda), unimodal (una moda) o bimodal o multimodal (dos o más modas).
Primero ordena los datos. Después pregúntate: ¿quiero el valor que queda al centro o el que más se repite? Si buscas el centro, calcula la mediana. Si buscas frecuencia, identifica la moda.
La mediana se fija en la posición de los datos ordenados, mientras que la moda se fija en la frecuencia de cada valor. Por eso, ambas medidas pueden ser distintas y describir aspectos diferentes de un mismo conjunto.
Ejemplo 1: mediana con cantidad impar de datos
Considera el conjunto:
\[ 7,\ 3,\ 5,\ 9,\ 4 \]
Paso 1: ordenar los datos.
\[ 3,\ 4,\ 5,\ 7,\ 9 \]
Paso 2: buscar el dato central.
Como hay 5 datos, la mediana es el tercer valor:
\[ \text{Mediana}=5 \]
Paso 3: revisar si hay moda.
Ningún valor se repite, por lo tanto no hay moda.
Ejemplo 2: mediana con cantidad par de datos
Considera el conjunto:
\[ 2,\ 8,\ 5,\ 6 \]
Paso 1: ordenar los datos.
\[ 2,\ 5,\ 6,\ 8 \]
Paso 2: identificar los dos valores centrales.
Como hay 4 datos, los dos centrales son \(5\) y \(6\).
Paso 3: calcular el promedio de esos dos valores.
\[ \text{Mediana}=\dfrac{5+6}{2}=5{,}5 \]
Moda: no hay moda, porque ningún dato se repite.
Ejemplo 3: identificación de la moda
Considera el conjunto:
\[ 4,\ 6,\ 4,\ 7,\ 4,\ 9,\ 6 \]
Paso 1: ordenar los datos.
\[ 4,\ 4,\ 4,\ 6,\ 6,\ 7,\ 9 \]
Paso 2: calcular la mediana.
Como hay 7 datos, la mediana es el cuarto valor:
\[ \text{Mediana}=6 \]
Paso 3: identificar la moda.
El valor que más se repite es \(4\), por lo tanto:
\[ \text{Moda}=4 \]
Conclusión: en este conjunto, la mediana y la moda son distintas.
Ejemplo 4: conjunto bimodal
Analicemos los datos:
\[ 2,\ 3,\ 3,\ 5,\ 5,\ 8 \]
Los datos ya están ordenados.
Mediana: como hay 6 datos, se promedian los dos centrales:
\[ \text{Mediana}=\dfrac{3+5}{2}=4 \]
Moda: los valores \(3\) y \(5\) aparecen dos veces cada uno.
Entonces, el conjunto tiene dos modas y es bimodal.
Ejemplo 5: lectura de tabla e interpretación
La siguiente tabla muestra la cantidad de horas de sueño de una estudiante durante 7 noches:
| Noche | Horas de sueño |
|---|---|
| Lunes | 7 |
| Martes | 8 |
| Miércoles | 7 |
| Jueves | 6 |
| Viernes | 7 |
| Sábado | 9 |
| Domingo | 8 |
Los datos son:
\[ 7,\ 8,\ 7,\ 6,\ 7,\ 9,\ 8 \]
Ordenamos:
\[ 6,\ 7,\ 7,\ 7,\ 8,\ 8,\ 9 \]
Mediana: el valor central es \(7\).
Moda: el valor que más se repite es \(7\).
Interpretación: tanto la mediana como la moda indican que dormir 7 horas fue un valor central y frecuente en la semana.
- Buscar la mediana sin ordenar antes los datos.
- Creer que la moda es siempre el dato mayor.
- Pensar que todo conjunto tiene moda.
- Olvidar que, si hay cantidad par de datos, la mediana se obtiene promediando los dos valores centrales.
La moda se usa mucho cuando interesa conocer la opción más frecuente, por ejemplo la talla de calzado más vendida o la respuesta más común en una encuesta. La mediana, en cambio, es muy útil cuando se quiere describir un valor central sin dejarse arrastrar tanto por valores extremos, como puede ocurrir con tiempos, edades o ingresos.
La mediana y la moda no compiten entre sí: cada una responde una pregunta distinta. La mediana responde cuál es el valor central del conjunto ordenado. La moda responde cuál es el valor más frecuente. En PAES M1 muchas veces lo importante no es solo calcular, sino decidir cuál de las dos medidas entrega una mejor descripción del contexto.
Ejercicios de práctica
- Calcula la mediana de \(5,\ 2,\ 8,\ 1,\ 6\).
- Calcula la mediana de \(4,\ 7,\ 9,\ 10\).
- Determina la moda de \(3,\ 5,\ 3,\ 7,\ 8,\ 3\).
- Determina la moda de \(2,\ 4,\ 6,\ 8,\ 10\).
- Calcula la mediana y la moda de \(1,\ 2,\ 2,\ 4,\ 7,\ 7,\ 9\).
- Calcula la mediana y la moda de \(6,\ 6,\ 8,\ 9,\ 10,\ 10\).
- Ordena los datos \(12,\ 9,\ 11,\ 9,\ 15,\ 10\) y luego calcula mediana y moda.
- Explica con tus palabras cuándo conviene observar la moda.
- Explica con tus palabras cuándo conviene observar la mediana.
- Construye un conjunto de 5 datos cuya mediana sea 8.
- Construye un conjunto de 6 datos que tenga dos modas.
- En el conjunto \(2,\ 2,\ 3,\ 4,\ 20\), calcula la mediana y la moda. Luego indica cuál de las dos describe mejor al grupo.
- Ordenando: \(1,2,5,6,8\).
\[ \text{Mediana}=5 \] - Ordenados: \(4,7,9,10\).
\[ \text{Mediana}=\dfrac{7+9}{2}=8 \] - El valor que más se repite es \(3\).
\[ \text{Moda}=3 \] - Ningún valor se repite, por lo tanto el conjunto es amodal.
- Los datos ya están ordenados: \(1,2,2,4,7,7,9\).
\[ \text{Mediana}=4 \] Las modas son \(2\) y \(7\). El conjunto es bimodal. - Los datos ya están ordenados: \(6,6,8,9,10,10\).
\[ \text{Mediana}=\dfrac{8+9}{2}=8{,}5 \] Las modas son \(6\) y \(10\). - Ordenando: \(9,9,10,11,12,15\).
\[ \text{Mediana}=\dfrac{10+11}{2}=10{,}5 \] \[ \text{Moda}=9 \] - Conviene observar la moda cuando interesa saber cuál es el valor que aparece con mayor frecuencia, por ejemplo en tallas, colores preferidos o respuestas repetidas en una encuesta.
- Conviene observar la mediana cuando interesa identificar el valor central del grupo, especialmente si hay datos muy altos o muy bajos que podrían distorsionar otras medidas.
- Una posible respuesta es: \(5,7,8,9,12\).
La mediana es el dato central: \[ \text{Mediana}=8 \] - Una posible respuesta es: \(2,2,4,4,7,9\).
Las modas son \(2\) y \(4\). - Los datos ya están ordenados: \(2,2,3,4,20\).
\[ \text{Mediana}=3 \] \[ \text{Moda}=2 \] Una posible interpretación es que la mediana describe mejor el centro del grupo, mientras que la moda indica el valor más repetido.
Si una pregunta pide interpretar un conjunto con datos repetidos, piensa en la moda. Si pide analizar el valor central del grupo, especialmente con datos ordenados o con valores extremos, piensa en la mediana.
Ejercicios tipo PAES
- La mediana del conjunto \(3,\ 5,\ 7,\ 9,\ 11\) es:
- \(5\)
- \(7\)
- \(9\)
- \(8\)
- La moda del conjunto \(4,\ 6,\ 4,\ 8,\ 9,\ 4,\ 10\) es:
- \(6\)
- \(4\)
- \(8\)
- \(9\)
- El conjunto \(2,\ 3,\ 5,\ 5,\ 8,\ 10\) tiene mediana igual a:
- \(5\)
- \(6{,}5\)
- \(5{,}5\)
- \(4\)
- ¿Cuál de los siguientes conjuntos es amodal?
- \(1,\ 1,\ 2,\ 3,\ 4\)
- \(2,\ 2,\ 3,\ 3,\ 5\)
- \(4,\ 5,\ 6,\ 7,\ 8\)
- \(6,\ 6,\ 6,\ 8,\ 9\)
- En un grupo, las edades son \(12,\ 13,\ 13,\ 14,\ 20\). ¿Cuál afirmación es correcta?
- La mediana es 13 y la moda es 13.
- La mediana es 14 y la moda es 13.
- La mediana es 13 y no hay moda.
- La mediana es 14 y la moda es 20.
- En el conjunto \(1,\ 2,\ 2,\ 3,\ 9\), ¿qué medida indica el valor más frecuente?
- La media
- La mediana
- La moda
- El rango
- Los datos ya están ordenados: \(3,5,7,9,11\).
Como hay 5 datos, la mediana es el valor central: \[ \text{Mediana}=7 \] Por lo tanto, la respuesta correcta es B. - El valor que más se repite es \(4\), pues aparece 3 veces.
\[ \text{Moda}=4 \] Por lo tanto, la respuesta correcta es B. - Hay 6 datos, por lo que la mediana es el promedio de los dos valores centrales: \[ \text{Mediana}=\dfrac{5+5}{2}=5 \] Por lo tanto, la respuesta correcta es A.
- Un conjunto amodal no tiene valores repetidos.
El único conjunto donde ningún dato se repite es: \[ 4,\ 5,\ 6,\ 7,\ 8 \] Por lo tanto, la respuesta correcta es C. - Los datos ya están ordenados: \(12,13,13,14,20\).
La mediana es el valor central: \[ \text{Mediana}=13 \] La moda es el valor que más se repite: \[ \text{Moda}=13 \] Por lo tanto, la respuesta correcta es A. - La medida que indica el valor más frecuente es la moda.
Por lo tanto, la respuesta correcta es C.
En PAES M1 no basta con saber calcular. También debes reconocer qué medida responde mejor a la pregunta: la mediana para el valor central y la moda para el valor más frecuente. Leer con atención qué se pide es tan importante como hacer bien la cuenta.
3. Tablas de frecuencia simple
Tablas de frecuencia simple [frecuencia absoluta (f), relativa
, acumulada (F), relativa acumulada (H), en decimal, fracción y porcentaje] (PAES M1)
Objetivo de la clase: organizar datos sueltos en una tabla de frecuencia simple, calcular frecuencia absoluta, relativa, acumulada y relativa acumulada, e interpretar estos valores en formato decimal, fracción y porcentaje.
Cuando un conjunto de datos comienza a crecer, deja de ser práctico mirar uno por uno todos los valores. En esos casos, conviene organizarlos en una tabla de frecuencia simple, porque permite ver con claridad cuántas veces aparece cada dato y qué proporción representa dentro del total.
En PAES M1 este contenido puede aparecer como cálculo directo, lectura de tabla, comparación entre frecuencias o interpretación de porcentajes acumulados.
- Frecuencia absoluta \(f\): cantidad de veces que aparece un dato.
- Frecuencia relativa \(h\): proporción del total que representa un dato. \[ h=\dfrac{f}{n} \] donde \(n\) es la cantidad total de datos.
- Frecuencia acumulada \(F\): suma progresiva de las frecuencias absolutas.
- Frecuencia relativa acumulada \(H\): suma progresiva de las frecuencias relativas.
La frecuencia relativa puede escribirse de tres maneras equivalentes:
- Como fracción: \(\dfrac{f}{n}\)
- Como decimal: resultado de dividir \(\dfrac{f}{n}\)
- Como porcentaje: \(h\cdot 100\%\)
Por ejemplo, si un dato aparece 3 veces en un total de 12 datos:
\[ h=\dfrac{3}{12}=\dfrac{1}{4}=0{,}25=25\% \]
- Ordena o identifica los valores distintos del conjunto.
- Cuenta cuántas veces aparece cada valor y completa \(f\).
- Suma todas las frecuencias absolutas para verificar que den el total \(n\).
- Calcula \(h=\dfrac{f}{n}\) para cada valor.
- Acumula progresivamente las frecuencias para obtener \(F\) y \(H\).
- Comprueba al final que la última frecuencia acumulada sea \(n\) y que la última frecuencia relativa acumulada sea \(1\) o \(100\%\).
- Confundir frecuencia absoluta con frecuencia relativa.
- Calcular \(h\) dividiendo por la cantidad de valores distintos en vez de dividir por el total de datos.
- Olvidar que la última frecuencia acumulada debe ser igual al total de datos.
- Olvidar que la última frecuencia relativa acumulada debe ser \(1\), o sea, \(100\%\).
- Sumar mal los porcentajes por redondeo y pensar que la tabla está mala, cuando el problema es solo de aproximación decimal.
Ejemplo 1: construcción básica de una tabla de frecuencia
Se preguntó a 10 estudiantes cuántos hermanos tienen. Las respuestas fueron:
\[ 0,\ 1,\ 2,\ 1,\ 3,\ 2,\ 1,\ 0,\ 2,\ 1 \]
Primero identificamos los valores distintos: \(0,\ 1,\ 2,\ 3\).
Luego contamos cuántas veces aparece cada uno:
| Número de hermanos | \(f\) | \(h\) | \(F\) | \(H\) |
|---|---|---|---|---|
| 0 | 2 | \(\dfrac{2}{10}=0{,}2=20\%\) | 2 | \(0{,}2=20\%\) |
| 1 | 4 | \(\dfrac{4}{10}=0{,}4=40\%\) | 6 | \(0{,}6=60\%\) |
| 2 | 3 | \(\dfrac{3}{10}=0{,}3=30\%\) | 9 | \(0{,}9=90\%\) |
| 3 | 1 | \(\dfrac{1}{10}=0{,}1=10\%\) | 10 | \(1=100\%\) |
Interpretación: el valor más frecuente es 1 hermano, porque tiene frecuencia absoluta 4. Además, el 60% de los estudiantes tiene a lo más 1 hermano, porque la frecuencia relativa acumulada hasta 1 es 60%.
Ejemplo 2: frecuencia relativa como fracción, decimal y porcentaje
En un curso, las preferencias de colación fueron:
\[ \text{fruta, sándwich, fruta, yogurt, fruta, sándwich, yogurt, fruta} \]
Hay 8 respuestas en total.
| Colación | \(f\) | Frecuencia relativa en fracción | Frecuencia relativa en decimal | Frecuencia relativa en porcentaje |
|---|---|---|---|---|
| Fruta | 4 | \(\dfrac{4}{8}=\dfrac{1}{2}\) | \(0{,}5\) | \(50\%\) |
| Sándwich | 2 | \(\dfrac{2}{8}=\dfrac{1}{4}\) | \(0{,}25\) | \(25\%\) |
| Yogurt | 2 | \(\dfrac{2}{8}=\dfrac{1}{4}\) | \(0{,}25\) | \(25\%\) |
Interpretación: la mitad del curso prefirió fruta. Eso puede expresarse como \(\dfrac{1}{2}\), como \(0{,}5\) o como \(50\%\).
Ejemplo 3: frecuencia acumulada y relativa acumulada
Se registró la cantidad de mascotas en 12 hogares:
\[ 0,\ 1,\ 1,\ 2,\ 0,\ 3,\ 2,\ 1,\ 2,\ 4,\ 1,\ 0 \]
Contamos cada valor y completamos la tabla:
| Mascotas | \(f\) | \(h\) | \(F\) | \(H\) |
|---|---|---|---|---|
| 0 | 3 | \(\dfrac{3}{12}=0{,}25=25\%\) | 3 | \(0{,}25=25\%\) |
| 1 | 4 | \(\dfrac{4}{12}=\dfrac{1}{3}\approx 0{,}333=33{,}3\%\) | 7 | \(\dfrac{7}{12}\approx 0{,}583=58{,}3\%\) |
| 2 | 3 | \(\dfrac{3}{12}=0{,}25=25\%\) | 10 | \(\dfrac{10}{12}\approx 0{,}833=83{,}3\%\) |
| 3 | 1 | \(\dfrac{1}{12}\approx 0{,}083=8{,}3\%\) | 11 | \(\dfrac{11}{12}\approx 0{,}917=91{,}7\%\) |
| 4 | 1 | \(\dfrac{1}{12}\approx 0{,}083=8{,}3\%\) | 12 | \(1=100\%\) |
Interpretación: el 83,3% de los hogares tiene a lo más 2 mascotas, porque la frecuencia relativa acumulada hasta 2 es aproximadamente \(0{,}833\).
Ejemplo 4: lectura directa desde una tabla
Observa la siguiente tabla sobre cantidad de libros leídos por 15 estudiantes en un mes:
| Libros leídos | \(f\) | \(h\) | \(F\) | \(H\) |
|---|---|---|---|---|
| 0 | 3 | \(0{,}2\) | 3 | \(0{,}2\) |
| 1 | 5 | \(\dfrac{1}{3}\approx 0{,}333\) | 8 | \(\dfrac{8}{15}\approx 0{,}533\) |
| 2 | 4 | \(\dfrac{4}{15}\approx 0{,}267\) | 12 | \(0{,}8\) |
| 3 | 2 | \(\dfrac{2}{15}\approx 0{,}133\) | 14 | \(\dfrac{14}{15}\approx 0{,}933\) |
| 4 | 1 | \(\dfrac{1}{15}\approx 0{,}067\) | 15 | \(1\) |
De esta tabla se puede concluir que:
- El dato más frecuente es 1 libro, porque tiene la mayor frecuencia absoluta.
- El 20% no leyó libros.
- El 80% leyó a lo más 2 libros.
- Solo 1 estudiante leyó 4 libros.
Cuando una pregunta dice “a lo más 2”, está incluyendo \(0\), \(1\) y \(2\). En una tabla de frecuencias, esa información se obtiene mirando la frecuencia acumulada o la frecuencia relativa acumulada hasta ese valor.
Las tablas de frecuencia se usan para resumir encuestas, resultados académicos, preferencias, tallas, tiempos de traslado, edades y muchos otros datos. Son muy útiles cuando se necesita comunicar información de forma ordenada y rápida, especialmente si se quiere comparar proporciones o acumulados.
Ejercicios de práctica
- En los datos \(1,\ 2,\ 2,\ 3,\ 1,\ 2,\ 4,\ 1\), construye una tabla con valor y frecuencia absoluta.
- Para los mismos datos del ejercicio anterior, calcula la frecuencia relativa de cada valor en forma decimal.
- Expresa la frecuencia relativa del valor 2 del ejercicio 1 como fracción y como porcentaje.
- En los datos \(0,\ 1,\ 1,\ 1,\ 2,\ 3,\ 3,\ 4\), calcula la frecuencia acumulada de cada valor.
- En un grupo de 10 estudiantes, 3 prefieren té, 5 prefieren jugo y 2 prefieren leche. Calcula la frecuencia relativa de cada preferencia en decimal y porcentaje.
- Construye una tabla de frecuencia simple para los datos \(5,\ 5,\ 6,\ 7,\ 5,\ 6,\ 8,\ 7,\ 6,\ 5\).
- En una tabla, el valor 4 tiene frecuencia absoluta 6 y el total de datos es 24. Calcula su frecuencia relativa como fracción, decimal y porcentaje.
- Si en una distribución la frecuencia acumulada hasta el valor 3 es 18, ¿qué significa eso en palabras?
- Si la frecuencia relativa acumulada hasta cierto valor es \(0{,}75\), ¿qué porcentaje representa?
- En un curso de 20 estudiantes, 4 obtuvieron nota 4, 8 obtuvieron nota 5, 6 obtuvieron nota 6 y 2 obtuvieron nota 7. Construye la tabla con \(f\), \(h\), \(F\) y \(H\).
- En la tabla del ejercicio anterior, ¿qué porcentaje obtuvo a lo más nota 5?
- En una encuesta de 12 personas, un resultado aparece 3 veces. ¿Cuál es su frecuencia relativa en fracción, decimal y porcentaje?
- Los valores distintos son \(1,2,3,4\).
Sus frecuencias absolutas son:- \(1 \rightarrow 3\)
- \(2 \rightarrow 3\)
- \(3 \rightarrow 1\)
- \(4 \rightarrow 1\)
- Como hay 8 datos:
- Para \(1\): \(h=\dfrac{3}{8}=0{,}375\)
- Para \(2\): \(h=\dfrac{3}{8}=0{,}375\)
- Para \(3\): \(h=\dfrac{1}{8}=0{,}125\)
- Para \(4\): \(h=\dfrac{1}{8}=0{,}125\)
- El valor 2 aparece 3 veces en 8 datos: \[ h=\dfrac{3}{8}=0{,}375=37{,}5\% \]
- Frecuencias absolutas:
- \(0 \rightarrow 1\)
- \(1 \rightarrow 3\)
- \(2 \rightarrow 1\)
- \(3 \rightarrow 2\)
- \(4 \rightarrow 1\)
- Hasta 0: \(1\)
- Hasta 1: \(4\)
- Hasta 2: \(5\)
- Hasta 3: \(7\)
- Hasta 4: \(8\)
- Total \(=10\).
- Té: \(\dfrac{3}{10}=0{,}3=30\%\)
- Jugo: \(\dfrac{5}{10}=0{,}5=50\%\)
- Leche: \(\dfrac{2}{10}=0{,}2=20\%\)
- Frecuencias absolutas:
- \(5 \rightarrow 4\)
- \(6 \rightarrow 3\)
- \(7 \rightarrow 2\)
- \(8 \rightarrow 1\)
- \(h(5)=0{,}4\)
- \(h(6)=0{,}3\)
- \(h(7)=0{,}2\)
- \(h(8)=0{,}1\)
- \(F: 4,7,9,10\)
- \(H: 0{,}4,\ 0{,}7,\ 0{,}9,\ 1\)
- \[ h=\dfrac{6}{24}=\dfrac{1}{4}=0{,}25=25\% \]
- Significa que hay 18 datos menores o iguales que 3, es decir, 18 observaciones con valor a lo más 3.
- \[ 0{,}75=75\% \]
- Total \(=20\).
Nota \(f\) \(h\) \(F\) \(H\) 4 4 \(\dfrac{4}{20}=0{,}2=20\%\) 4 \(0{,}2\) 5 8 \(\dfrac{8}{20}=0{,}4=40\%\) 12 \(0{,}6\) 6 6 \(\dfrac{6}{20}=0{,}3=30\%\) 18 \(0{,}9\) 7 2 \(\dfrac{2}{20}=0{,}1=10\%\) 20 \(1\) - A lo más nota 5 corresponde a la frecuencia relativa acumulada hasta 5: \[ 0{,}6=60\% \]
- \[ h=\dfrac{3}{12}=\dfrac{1}{4}=0{,}25=25\% \]
Si la pregunta habla de “qué parte del total”, probablemente debas mirar la frecuencia relativa. Si habla de “cuántos tienen a lo más”, probablemente debas mirar una frecuencia acumulada.
Ejercicios tipo PAES
- En un grupo de 20 personas, 5 prefieren el color azul. La frecuencia relativa de quienes prefieren azul es:
- \(0{,}4\)
- \(\dfrac{1}{4}\)
- \(30\%\)
- \(5\%\)
- Si un valor tiene frecuencia absoluta 6 en un total de 24 datos, su frecuencia relativa en porcentaje es:
- \(20\%\)
- \(30\%\)
- \(25\%\)
- \(40\%\)
- En una tabla de frecuencias, la última frecuencia acumulada debe ser igual a:
- la cantidad de valores distintos
- la suma de las frecuencias relativas
- el total de datos
- el dato de mayor valor
- En una distribución, la frecuencia relativa acumulada hasta cierto valor es \(0{,}8\). Esto significa que:
- el 8% de los datos corresponde exactamente a ese valor
- el 80% de los datos está en ese valor o por debajo de él
- faltan 8 datos para completar el total
- la frecuencia absoluta es 0,8
- En una encuesta a 16 personas, una respuesta aparece 4 veces. ¿Cuál de las siguientes expresiones representa correctamente su frecuencia relativa?
- \(\dfrac{4}{16}=\dfrac{1}{4}=0{,}25=25\%\)
- \(\dfrac{4}{16}=0{,}4=40\%\)
- \(\dfrac{4}{16}=\dfrac{1}{8}=0{,}125=12{,}5\%\)
- \(\dfrac{4}{16}=4\%=0{,}04\)
- La siguiente tabla resume el número de hijos en 10 familias:
¿Qué porcentaje de las familias tiene a lo más 1 hijo?Hijos \(f\) 0 2 1 3 2 4 3 1 - \(40\%\)
- \(50\%\)
- \(60\%\)
- \(70\%\)
- La frecuencia relativa es: \[ h=\dfrac{5}{20}=\dfrac{1}{4}=0{,}25 \] La alternativa que representa correctamente ese valor es \(\dfrac{1}{4}\).
Respuesta correcta: B - \[ h=\dfrac{6}{24}=\dfrac{1}{4}=0{,}25=25\% \] Respuesta correcta: C
- La frecuencia acumulada suma progresivamente todas las frecuencias absolutas, por lo tanto al final debe coincidir con el total de datos.
Respuesta correcta: C - Una frecuencia relativa acumulada de \(0{,}8\) significa: \[ 0{,}8=80\% \] Es decir, el 80% de los datos está en ese valor o por debajo de él.
Respuesta correcta: B - \[ h=\dfrac{4}{16}=\dfrac{1}{4}=0{,}25=25\% \] Respuesta correcta: A
- A lo más 1 hijo significa considerar las familias con 0 hijos y con 1 hijo.
\[ 2+3=5 \]
Como hay 10 familias en total:
\[ \dfrac{5}{10}=0{,}5=50\% \]
Por lo tanto, la respuesta correcta es B.
4. Media, moda y mediana en tablas simples de frecuencias (PAES M1)
Media, moda y mediana en tablas simples de frecuencias (PAES M1)
Objetivo de la clase: calcular e interpretar la media, la mediana y la moda a partir de tablas simples de frecuencias, comparando cuál medida central describe mejor un conjunto de datos según el contexto.
En la página anterior aprendiste a construir e interpretar tablas de frecuencia simple con frecuencia absoluta, relativa y acumulada. Ahora daremos un paso más: usar esa información para calcular las tres medidas de tendencia central más importantes, es decir, la media, la mediana y la moda.
La idea clave es que, aunque ya no veamos los datos uno por uno, la tabla conserva la información necesaria para resumir el conjunto y tomar decisiones, algo muy frecuente en preguntas tipo PAES M1.
Si un valor \(x_i\) aparece \(f_i\) veces, entonces ese dato se repite esa cantidad de veces dentro del conjunto.
La suma de todas las frecuencias absolutas corresponde al total de datos:
\[ n=f_1+f_2+\cdots+f_k \]
- Media: \[ \bar{x}=\dfrac{x_1f_1+x_2f_2+\cdots+x_kf_k}{n} \]
- Moda: es el valor que tiene mayor frecuencia absoluta.
- Mediana: corresponde al valor central del conjunto ordenado. En una tabla, se identifica usando la frecuencia acumulada.
- Calcula el total de datos \(n\).
- Para la media, multiplica cada valor por su frecuencia y suma esos productos.
- Para la moda, busca la frecuencia absoluta más alta.
- Para la mediana, ubica la posición central usando \(n\) y luego mira en qué valor cae esa posición según la frecuencia acumulada.
Trabajar con una tabla de frecuencias no cambia el significado de media, mediana y moda. Lo único que cambia es la forma de calcularlas. La tabla permite resumir muchos datos sin escribirlos todos.
Ejemplo 1: calcular la moda desde una tabla
La siguiente tabla muestra la cantidad de hermanos de 12 estudiantes:
| Número de hermanos | Frecuencia \(f\) |
|---|---|
| 0 | 2 |
| 1 | 5 |
| 2 | 3 |
| 3 | 2 |
La moda es el valor con mayor frecuencia.
La frecuencia más alta es \(5\), que corresponde al valor \(1\).
\[ \text{Moda}=1 \]
Interpretación: el número de hermanos más frecuente en este grupo es 1.
Ejemplo 2: calcular la media desde una tabla
Considera la tabla:
| Puntaje | Frecuencia \(f\) | \(x\cdot f\) |
|---|---|---|
| 2 | 3 | 6 |
| 3 | 4 | 12 |
| 4 | 2 | 8 |
| 5 | 1 | 5 |
| Total | 10 | 31 |
Como la suma de las frecuencias es \(10\), hay 10 datos en total.
La suma de los productos \(x\cdot f\) es \(31\).
Entonces:
\[ \bar{x}=\dfrac{31}{10}=3{,}1 \]
Interpretación: el puntaje promedio es \(3{,}1\).
Ejemplo 3: calcular la mediana con frecuencia acumulada
La tabla muestra la cantidad de mascotas en 9 hogares:
| Mascotas | \(f\) | \(F\) |
|---|---|---|
| 0 | 2 | 2 |
| 1 | 3 | 5 |
| 2 | 2 | 7 |
| 3 | 2 | 9 |
Como hay \(n=9\) datos, la mediana corresponde a la posición:
\[ \dfrac{9+1}{2}=5 \]
Ahora observamos en qué valor cae la posición 5.
Según la frecuencia acumulada:
- hasta 0 mascotas llegamos a la posición 2,
- hasta 1 mascota llegamos a la posición 5.
Entonces la posición 5 corresponde al valor 1.
\[ \text{Mediana}=1 \]
Ejemplo 4: mediana con cantidad par de datos
La siguiente tabla resume las notas de 8 estudiantes:
| Nota | \(f\) | \(F\) |
|---|---|---|
| 4 | 2 | 2 |
| 5 | 3 | 5 |
| 6 | 2 | 7 |
| 7 | 1 | 8 |
Como hay \(n=8\) datos, la mediana se obtiene promediando las posiciones 4 y 5.
Según la frecuencia acumulada, tanto la posición 4 como la posición 5 caen en la nota 5.
Entonces:
\[ \text{Mediana}=\dfrac{5+5}{2}=5 \]
Ejemplo 5: comparación entre media, mediana y moda
Observa la tabla:
| Valor | \(f\) | \(x\cdot f\) | \(F\) |
|---|---|---|---|
| 2 | 4 | 8 | 4 |
| 3 | 3 | 9 | 7 |
| 4 | 1 | 4 | 8 |
| 10 | 1 | 10 | 9 |
| Total | 9 | 31 | 9 |
Moda: la frecuencia más alta es 4, por lo tanto la moda es 2.
Mediana: como \(n=9\), la mediana es la posición 5. Según la frecuencia acumulada, la posición 5 cae en el valor 3.
\[ \text{Mediana}=3 \]
Media:
\[ \bar{x}=\dfrac{31}{9}\approx 3{,}44 \]
Conclusión: en esta tabla, media, mediana y moda son distintas. Cada una describe un aspecto diferente del conjunto.
- Calcular la media sumando solo los valores y olvidando multiplicar por sus frecuencias.
- Confundir la moda con el valor mayor de la tabla.
- Buscar la mediana sin considerar la frecuencia acumulada.
- En cantidad par de datos, olvidar promediar las dos posiciones centrales.
En contextos reales, como resultados de pruebas, tiempos de viaje o número de hijos por familia, las tres medidas pueden contar historias distintas. La moda muestra lo más frecuente, la mediana muestra el centro del conjunto y la media resume globalmente todos los datos. En PAES M1 es común que te pidan decidir cuál describe mejor la situación.
Ejercicios de práctica
- En la tabla \(x: 1,2,3\) con frecuencias \(f: 2,5,1\), determina la moda.
- En la tabla \(x: 2,4,6\) con frecuencias \(f: 3,2,1\), calcula la media.
- En la tabla \(x: 1,2,3,4\) con frecuencias \(f: 1,2,3,2\), calcula la moda.
- En la tabla \(x: 3,4,5\) con frecuencias \(f: 2,4,2\), determina la mediana.
- Construye la columna \(x\cdot f\) para la tabla \(x: 2,3,5\) con frecuencias \(f: 4,1,2\).
- En la tabla \(x: 0,1,2,3\) con frecuencias \(f: 1,3,4,2\), calcula la media.
- En la tabla \(x: 4,5,6,7\) con frecuencias \(f: 2,3,2,1\), calcula la mediana.
- En la tabla \(x: 1,2,6\) con frecuencias \(f: 4,3,1\), calcula media, mediana y moda.
- Explica con tus palabras cómo se obtiene la moda en una tabla de frecuencias.
- Explica con tus palabras cómo se obtiene la mediana en una tabla de frecuencias.
- En la tabla \(x: 2,3,4,10\) con frecuencias \(f: 3,3,2,1\), calcula media, mediana y moda.
- ¿Cuál medida central representa mejor el conjunto del ejercicio anterior? Justifica brevemente.
- La frecuencia mayor es \(5\), que corresponde al valor \(2\).
\[ \text{Moda}=2 \] - \[ \bar{x}=\dfrac{2\cdot 3+4\cdot 2+6\cdot 1}{3+2+1} =\dfrac{6+8+6}{6} =\dfrac{20}{6} =\dfrac{10}{3}\approx 3{,}33 \]
- La mayor frecuencia es \(3\), correspondiente al valor \(3\).
\[ \text{Moda}=3 \] - Total de datos: \[ n=2+4+2=8 \] Las posiciones centrales son la 4 y la 5. Ambas caen en el valor 4, por lo tanto: \[ \text{Mediana}=4 \]
- \[ 2\cdot 4=8,\quad 3\cdot 1=3,\quad 5\cdot 2=10 \] Entonces la columna \(x\cdot f\) es: \(8,3,10\).
- \[ \bar{x}=\dfrac{0\cdot 1+1\cdot 3+2\cdot 4+3\cdot 2}{1+3+4+2} =\dfrac{0+3+8+6}{10} =\dfrac{17}{10}=1{,}7 \]
- Total: \[ n=2+3+2+1=8 \] Las posiciones 4 y 5 caen en el valor 5, entonces: \[ \text{Mediana}=5 \]
- Total: \[ n=4+3+1=8 \] Moda: la mayor frecuencia es 4, entonces la moda es 1.
Mediana: las posiciones 4 y 5 son 1 y 2, entonces: \[ \text{Mediana}=\dfrac{1+2}{2}=1{,}5 \] Media: \[ \bar{x}=\dfrac{1\cdot 4+2\cdot 3+6\cdot 1}{8} =\dfrac{4+6+6}{8} =\dfrac{16}{8}=2 \] - Se obtiene buscando el valor que tiene la frecuencia absoluta más alta, es decir, el dato que más se repite en la tabla.
- Se obtiene ubicando la posición central del total de datos y observando, con ayuda de la frecuencia acumulada, en qué valor cae esa posición.
- Total: \[ n=3+3+2+1=9 \] Moda: las mayores frecuencias son 3 y 3, por lo tanto las modas son 2 y 3.
Mediana: la posición central es la 5. Esa posición cae en el valor 3, entonces: \[ \text{Mediana}=3 \] Media: \[ \bar{x}=\dfrac{2\cdot 3+3\cdot 3+4\cdot 2+10\cdot 1}{9} =\dfrac{6+9+8+10}{9} =\dfrac{33}{9} =\dfrac{11}{3}\approx 3{,}67 \] - Una buena respuesta es que la mediana describe mejor el centro del conjunto, porque el valor 10 eleva la media y hace que se aleje un poco de la mayor parte de los datos.
Cuando una tabla incluye valores extremos, conviene comparar la media con la mediana. Si la media se aleja bastante del centro de los datos, la mediana suele representar mejor al grupo.
Ejercicios tipo PAES
- La siguiente tabla muestra los resultados de una encuesta:
¿Cuál es la moda?Valor \(f\) 1 2 2 5 3 1 - \(2\)
- \(1\)
- \(3\)
- \(8\)
- En una tabla de frecuencias, los valores son \(2,\ 4,\ 6\) y sus frecuencias son \(1,\ 2,\ 1\). La media es:
- \(4\)
- \(3\)
- \(4{,}5\)
- \(5\)
- La tabla siguiente resume 7 datos:
¿Cuál es la mediana?Valor \(f\) 2 3 4 2 5 2 - \(5\)
- \(3\)
- \(2\)
- \(4\)
- En la tabla \(x: 1,2,3,4\) con frecuencias \(f: 2,4,1,1\), ¿cuál afirmación es correcta?
- La moda es 4.
- La media es 2.
- La mediana es 3.
- No existe moda.
- En la tabla \(x: 2,3,8\) con frecuencias \(f: 4,3,1\), la comparación correcta entre medidas es:
- Media = mediana = moda
- Moda \(=2\), mediana \(=2{,}5\), media \(=3{,}125\)
- Moda \(=3\), mediana \(=3\), media \(=2\)
- Moda \(=2\), mediana \(=2\), media \(=3{,}125\)
- En una tabla de frecuencias, un valor extremo alto hace que:
- la moda siempre cambie
- la mediana deje de existir
- la media pueda aumentar más que la mediana
- las tres medidas sean siempre iguales
- La frecuencia mayor es \(5\), correspondiente al valor \(2\).
\[ \text{Moda}=2 \] Respuesta correcta: A - \[ \bar{x}=\dfrac{2\cdot 1+4\cdot 2+6\cdot 1}{1+2+1} =\dfrac{2+8+6}{4} =\dfrac{16}{4}=4 \] Respuesta correcta: A
- Total de datos: \[ n=3+2+2=7 \] La posición central es: \[ \dfrac{7+1}{2}=4 \] Las posiciones 1, 2 y 3 corresponden al valor 2. La posición 4 corresponde al valor 4. \[ \text{Mediana}=4 \] Respuesta correcta: D
- Total: \[ n=2+4+1+1=8 \] Moda: la frecuencia más alta es 4, por lo tanto la moda es 2.
Media: \[ \bar{x}=\dfrac{1\cdot 2+2\cdot 4+3\cdot 1+4\cdot 1}{8} =\dfrac{2+8+3+4}{8} =\dfrac{17}{8}=2{,}125 \] Mediana: las posiciones 4 y 5 caen en el valor 2, entonces la mediana es 2.
La afirmación correcta es que la media es cercana a 2, pero la única afirmación exacta entre las opciones es:
Respuesta correcta: B - Total: \[ n=4+3+1=8 \] Moda: la mayor frecuencia es 4, así que la moda es 2.
Mediana: las posiciones 4 y 5 son 2 y 3, por lo tanto: \[ \text{Mediana}=\dfrac{2+3}{2}=2{,}5 \] Media: \[ \bar{x}=\dfrac{2\cdot 4+3\cdot 3+8\cdot 1}{8} =\dfrac{8+9+8}{8} =\dfrac{25}{8}=3{,}125 \] Respuesta correcta: B - Un valor extremo alto puede arrastrar la media hacia arriba, mientras la mediana suele cambiar menos.
Respuesta correcta: C
En preguntas tipo PAES, no basta con hacer cuentas. También debes revisar si las alternativas son coherentes con los cálculos. La moda depende de la frecuencia más alta, la mediana depende de la posición central y la media depende de todos los datos.
5. tablas de datos agrupados por intervalos
Confección de tablas de datos agrupados por intervalos [marca de clase, \(f\), \(F\), \(h\), \(H\), intervalos aparentes e intervalos reales] (PAES M1)
Objetivo de la clase: organizar datos cuantitativos en tablas agrupadas por intervalos, calcular marca de clase, frecuencia absoluta, frecuencia acumulada, frecuencia relativa y frecuencia relativa acumulada, distinguiendo además entre intervalos aparentes e intervalos reales.
Cuando la cantidad de datos es grande o los valores son muy variados, deja de ser práctico trabajar con cada dato por separado. En esos casos conviene agrupar los datos en intervalos, porque así se puede resumir la información y observar mejor cómo se distribuye.
En esta clase aprenderás a confeccionar una tabla de datos agrupados por intervalos, identificar sus elementos principales y distinguir entre intervalos aparentes e intervalos reales, algo muy importante cuando los datos provienen de mediciones.
- Intervalos de clase: grupos de valores, por ejemplo \(10{-}14\), \(15{-}19\), \(20{-}24\).
- Frecuencia absoluta \(f\): cantidad de datos que caen en cada intervalo.
- Frecuencia acumulada \(F\): suma progresiva de las frecuencias absolutas.
- Frecuencia relativa \(h\): proporción que representa cada intervalo respecto del total. \[ h=\dfrac{f}{n} \]
- Frecuencia relativa acumulada \(H\): suma progresiva de las frecuencias relativas.
- Marca de clase \(x_i\): punto medio del intervalo. \[ x_i=\dfrac{\text{límite inferior}+\text{límite superior}}{2} \]
Intervalo aparente: es el que se escribe directamente en la tabla, por ejemplo \(10{-}14\).
Intervalo real: es el que realmente cubre los valores cuando la variable fue registrada con una unidad determinada.
Por ejemplo, si los datos fueron anotados en números enteros, el intervalo aparente \(10{-}14\) tiene como intervalo real:
\[ 9{,}5 \le x < 14{,}5 \]
y el intervalo aparente \(15{-}19\) tiene como intervalo real:
\[ 14{,}5 \le x < 19{,}5 \]
Aunque los intervalos aparentes y los intervalos reales se escriben de manera distinta, ambos entregan la misma marca de clase, porque tienen el mismo punto medio.
Por ejemplo, para el intervalo aparente \(10{-}14\), su intervalo real es \(9{,}5 \le x < 14{,}5\).
Si calculamos la marca de clase con los extremos aparentes, obtenemos:
\[ \dfrac{10+14}{2}=12 \]
Y si la calculamos con los extremos reales, obtenemos:
\[ \dfrac{9{,}5+14{,}5}{2}=12 \]
Por lo tanto, la marca de clase es la misma en ambos casos.
Sin embargo, los intervalos reales serán muy útiles más adelante, especialmente cuando trabajemos con mayor precisión la media y la mediana en datos agrupados.
- Revisa el conjunto de datos y observa desde qué valor mínimo hasta qué valor máximo se extiende.
- Elige intervalos que cubran todo el rango de datos, sin superponerse.
- Cuenta cuántos datos caen en cada intervalo y completa \(f\).
- Calcula la marca de clase de cada intervalo.
- Obtén \(F\), \(h\) y \(H\).
- Verifica al final que la última frecuencia acumulada sea \(n\) y que la última frecuencia relativa acumulada sea \(1\) o \(100\%\).
Ejemplo 1: construcción de una tabla agrupada
Se registraron las edades de 20 personas:
\[ 12,\ 13,\ 15,\ 16,\ 17,\ 18,\ 19,\ 19,\ 20,\ 21,\ 22,\ 23,\ 24,\ 24,\ 25,\ 26,\ 27,\ 28,\ 29,\ 30 \]
Elegimos intervalos aparentes de amplitud 5:
\[ 10{-}14,\quad 15{-}19,\quad 20{-}24,\quad 25{-}29,\quad 30{-}34 \]
Luego escribimos sus intervalos reales, calculamos la marca de clase y contamos cuántos datos hay en cada intervalo.
| Intervalo aparente | Intervalo real | Marca de clase \(x_i\) | \(f\) | \(F\) | \(h\) | \(H\) |
|---|---|---|---|---|---|---|
| \(10{-}14\) | \(9{,}5 \le x < 14{,}5\) | 12 | 2 | 2 | \(\dfrac{2}{20}=0{,}1=10\%\) | \(0{,}1=10\%\) |
| \(15{-}19\) | \(14{,}5 \le x < 19{,}5\) | 17 | 6 | 8 | \(\dfrac{6}{20}=0{,}3=30\%\) | \(0{,}4=40\%\) |
| \(20{-}24\) | \(19{,}5 \le x < 24{,}5\) | 22 | 6 | 14 | \(\dfrac{6}{20}=0{,}3=30\%\) | \(0{,}7=70\%\) |
| \(25{-}29\) | \(24{,}5 \le x < 29{,}5\) | 27 | 5 | 19 | \(\dfrac{5}{20}=0{,}25=25\%\) | \(0{,}95=95\%\) |
| \(30{-}34\) | \(29{,}5 \le x < 34{,}5\) | 32 | 1 | 20 | \(\dfrac{1}{20}=0{,}05=5\%\) | \(1=100\%\) |
Interpretación: el 30% de los datos está entre 15 y 19 años, y el 70% está a lo más en el intervalo \(20{-}24\).
Ejemplo 2: misma marca de clase usando intervalos aparentes o reales
Consideremos el intervalo aparente \(20{-}24\). Su intervalo real es:
\[ 19{,}5 \le x < 24{,}5 \]
Si usamos el intervalo aparente, la marca de clase es:
\[ \dfrac{20+24}{2}=22 \]
Si usamos el intervalo real, la marca de clase es:
\[ \dfrac{19{,}5+24{,}5}{2}=22 \]
Conclusión: ambos intervalos entregan la misma marca de clase.
Por eso, al confeccionar la tabla, la marca de clase puede calcularse directamente desde el intervalo aparente. Sin embargo, los intervalos reales son útiles para interpretar con mayor precisión qué valores pertenecen realmente a cada clase.
Ejemplo 3: cálculo de marcas de clase
Considera los siguientes intervalos aparentes:
\[ 5{-}9,\quad 10{-}14,\quad 15{-}19,\quad 20{-}24 \]
Sus marcas de clase son:
- \[ \dfrac{5+9}{2}=7 \]
- \[ \dfrac{10+14}{2}=12 \]
- \[ \dfrac{15+19}{2}=17 \]
- \[ \dfrac{20+24}{2}=22 \]
Interpretación: la marca de clase representa el valor central de cada intervalo y se usará más adelante para estimar la media en datos agrupados.
Ejemplo 4: lectura de una tabla agrupada
Observa la siguiente tabla sobre tiempos de traslado de 25 estudiantes:
| Intervalo aparente | Intervalo real | Marca de clase | \(f\) | \(F\) | \(h\) | \(H\) |
|---|---|---|---|---|---|---|
| \(0{-}9\) | \(-0{,}5 \le x < 9{,}5\) | \(4{,}5\) | 4 | 4 | \(\dfrac{4}{25}=0{,}16=16\%\) | \(0{,}16=16\%\) |
| \(10{-}19\) | \(9{,}5 \le x < 19{,}5\) | \(14{,}5\) | 8 | 12 | \(\dfrac{8}{25}=0{,}32=32\%\) | \(0{,}48=48\%\) |
| \(20{-}29\) | \(19{,}5 \le x < 29{,}5\) | \(24{,}5\) | 7 | 19 | \(\dfrac{7}{25}=0{,}28=28\%\) | \(0{,}76=76\%\) |
| \(30{-}39\) | \(29{,}5 \le x < 39{,}5\) | \(34{,}5\) | 4 | 23 | \(\dfrac{4}{25}=0{,}16=16\%\) | \(0{,}92=92\%\) |
| \(40{-}49\) | \(39{,}5 \le x < 49{,}5\) | \(44{,}5\) | 2 | 25 | \(\dfrac{2}{25}=0{,}08=8\%\) | \(1=100\%\) |
De esta tabla se puede concluir que:
- El intervalo más frecuente es \(10{-}19\) minutos.
- El 48% tarda a lo más 19 minutos.
- El 76% tarda a lo más 29 minutos.
- La marca de clase del intervalo \(30{-}39\) es \(34{,}5\).
- Construir intervalos que se traslapan, por ejemplo \(10{-}15\) y \(15{-}20\), sin aclarar el criterio.
- Confundir marca de clase con amplitud del intervalo.
- Olvidar que la última frecuencia acumulada debe coincidir con el total de datos.
- Calcular mal la frecuencia relativa al no dividir por el total.
- Creer que intervalo aparente e intervalo real entregan distinta marca de clase.
Las tablas agrupadas por intervalos se usan para resumir edades, estaturas, pesos, tiempos, puntajes y otras variables cuantitativas. Son muy útiles cuando hay muchos datos y se necesita observar tendencias generales en vez de revisar cada valor por separado.
Ejercicios de práctica
- Calcula la marca de clase de los intervalos \(10{-}14\), \(15{-}19\) y \(20{-}24\).
- Escribe los intervalos reales correspondientes a los intervalos aparentes \(30{-}34\) y \(35{-}39\).
- En una tabla agrupada, un intervalo tiene frecuencia absoluta 6 y el total de datos es 24. Calcula su frecuencia relativa en fracción, decimal y porcentaje.
- Si las frecuencias absolutas de tres intervalos son \(4,\ 7,\ 9\), calcula las frecuencias acumuladas.
- Si las frecuencias relativas de cuatro intervalos son \(0{,}2,\ 0{,}35,\ 0{,}25,\ 0{,}2\), calcula las frecuencias relativas acumuladas.
- Completa la siguiente idea: la marca de clase del intervalo \(12{-}18\) es \( \underline{\hspace{1.5cm}} \).
- Construye una tabla con intervalos \(0{-}4\), \(5{-}9\), \(10{-}14\) si las frecuencias son \(3,\ 5,\ 2\). Agrega \(F\).
- En una tabla agrupada, la última frecuencia acumulada es 40. ¿Qué significa eso?
- En una distribución, la frecuencia relativa acumulada hasta el tercer intervalo es \(0{,}85\). ¿Qué porcentaje representa?
- Explica con tus palabras la diferencia entre intervalo aparente e intervalo real.
- Si el intervalo aparente es \(50{-}59\), ¿cuál es su marca de clase?
- Si una tabla tiene intervalos \(100{-}109\), \(110{-}119\), \(120{-}129\), escribe los intervalos reales correspondientes.
- \[ \dfrac{10+14}{2}=12,\qquad \dfrac{15+19}{2}=17,\qquad \dfrac{20+24}{2}=22 \]
- \[ 29{,}5 \le x < 34{,}5 \] y \[ 34{,}5 \le x < 39{,}5 \]
- \[ h=\dfrac{6}{24}=\dfrac{1}{4}=0{,}25=25\% \]
- Las frecuencias acumuladas son: \[ 4,\quad 11,\quad 20 \]
- Las frecuencias relativas acumuladas son: \[ 0{,}2,\quad 0{,}55,\quad 0{,}8,\quad 1 \]
- \[ \dfrac{12+18}{2}=15 \]
-
Intervalo \(f\) \(F\) \(0{-}4\) 3 3 \(5{-}9\) 5 8 \(10{-}14\) 2 10 - Significa que el total de datos de la distribución es 40.
- \[ 0{,}85=85\% \]
- El intervalo aparente es el que se escribe en la tabla, por ejemplo \(10{-}14\). El intervalo real ajusta los límites para representar correctamente mediciones continuas, por ejemplo \(9{,}5 \le x < 14{,}5\).
- \[ \dfrac{50+59}{2}=54{,}5 \]
- \[ 99{,}5 \le x < 109{,}5,\qquad 109{,}5 \le x < 119{,}5,\qquad 119{,}5 \le x < 129{,}5 \]
Cuando aparezca una tabla agrupada, revisa primero si te piden leer frecuencias, interpretar acumulados, calcular marcas de clase o distinguir entre intervalo aparente e intervalo real. Muchas veces el error no está en la cuenta, sino en no identificar qué representa cada columna.
Ejercicios tipo PAES
- La marca de clase del intervalo \(20{-}29\) es:
- \(24{,}5\)
- \(25\)
- \(9\)
- \(49\)
- Si un intervalo tiene frecuencia absoluta 8 y el total de datos es 40, su frecuencia relativa en porcentaje es:
- \(8\%\)
- \(25\%\)
- \(40\%\)
- \(20\%\)
- La última frecuencia acumulada de una tabla agrupada representa:
- la amplitud del último intervalo
- el total de datos
- la suma de las marcas de clase
- la frecuencia relativa mayor
- El intervalo real correspondiente al intervalo aparente \(15{-}19\), si los datos fueron registrados en enteros, es:
- \(15 \le x \le 19\)
- \(14{,}5 \le x < 19{,}5\)
- \(15{,}5 \le x < 19{,}5\)
- \(14 \le x < 20\)
- Si las frecuencias absolutas de tres intervalos son \(5,\ 7,\ 3\), entonces la frecuencia acumulada del segundo intervalo es:
- \(15\)
- \(10\)
- \(12\)
- \(7\)
- En una tabla agrupada, la frecuencia relativa acumulada hasta el cuarto intervalo es \(0{,}9\). Esto significa que:
- el 90% de los datos está exactamente en el cuarto intervalo
- el 9% de los datos está bajo el cuarto intervalo
- faltan 0,1 datos para completar el total
- el 90% de los datos está en ese intervalo o en los anteriores
- La marca de clase se calcula promediando los extremos del intervalo: \[ \dfrac{20+29}{2}=24{,}5 \] Respuesta correcta: A
- \[ h=\dfrac{8}{40}=0{,}2=20\% \] Respuesta correcta: D
- La frecuencia acumulada suma progresivamente las frecuencias absolutas. Por eso, la última debe coincidir con el total de datos.
Respuesta correcta: B - Al pasar de intervalo aparente a real en datos enteros, se resta \(0{,}5\) al límite inferior y se suma \(0{,}5\) al superior: \[ 14{,}5 \le x < 19{,}5 \] Respuesta correcta: B
- La frecuencia acumulada del segundo intervalo es: \[ 5+7=12 \] Respuesta correcta: C
- Una frecuencia relativa acumulada de \(0{,}9\) significa: \[ 0{,}9=90\% \] Entonces, el 90% de los datos está en ese intervalo o en los anteriores.
Respuesta correcta: D
En tablas agrupadas por intervalos, cada columna tiene un significado distinto. Para responder bien en PAES M1, debes distinguir entre contar datos, acumular frecuencias, expresar proporciones, calcular marcas de clase y reconocer que los intervalos aparentes y reales comparten el mismo punto medio, aunque describen la clase con distinto nivel de precisión.
6. Media en datos agrupados
Media en datos agrupados [marca de clase, aproximación] (PAES M1)
Objetivo de la clase: calcular e interpretar la media en datos agrupados usando la marca de clase, comprendiendo que el resultado obtenido es una aproximación del promedio real.
Cuando los datos están agrupados por intervalos, ya no conocemos cada valor exacto del conjunto. En ese caso, la media no se puede calcular de manera exacta como en los datos sueltos, sino que se estima usando la marca de clase de cada intervalo.
Por eso, en esta unidad la media en datos agrupados debe entenderse como una aproximación. Aun así, sigue siendo muy útil para resumir la distribución y comparar grupos, algo que aparece con frecuencia en ejercicios tipo PAES M1.
Si una tabla tiene marcas de clase \(x_i\) y frecuencias absolutas \(f_i\), la media agrupada se calcula con:
\[ \bar{x}\approx \dfrac{x_1f_1+x_2f_2+\cdots+x_kf_k}{n} \]
donde \(n=f_1+f_2+\cdots+f_k\) es el total de datos.
Aparece porque no estamos usando los datos reales uno por uno, sino la marca de clase como representante de todos los valores de cada intervalo. Eso permite estimar la media, pero no garantiza que coincida exactamente con el promedio real del conjunto.
- Identifica la marca de clase de cada intervalo.
- Multiplica cada marca de clase por su frecuencia.
- Suma todos los productos \(x_i\cdot f_i\).
- Suma las frecuencias para obtener el total \(n\).
- Divide: \[ \bar{x}\approx\dfrac{\sum x_if_i}{n} \]
La media en datos agrupados no suele ser exacta. Se trata de una estimación. El error más común es olvidar esto y hablar del resultado como si fuera el promedio exacto de todos los datos originales.
Ejemplo 1: cálculo básico de la media agrupada
La siguiente tabla resume las edades de 20 personas:
| Intervalo | Marca de clase \(x_i\) | \(f_i\) | \(x_i\cdot f_i\) |
|---|---|---|---|
| \(10{-}14\) | 12 | 2 | 24 |
| \(15{-}19\) | 17 | 6 | 102 |
| \(20{-}24\) | 22 | 6 | 132 |
| \(25{-}29\) | 27 | 5 | 135 |
| \(30{-}34\) | 32 | 1 | 32 |
| Total | - | 20 | 425 |
Aplicamos la fórmula:
\[ \bar{x}\approx\dfrac{425}{20}=21{,}25 \]
Interpretación: la edad media del grupo es aproximadamente \(21{,}25\) años.
Ejemplo 2: por qué es una aproximación
Supongamos que en el intervalo \(20{-}24\) hay 6 personas. En la media agrupada, a esas 6 personas se les representa usando la marca de clase \(22\).
Eso equivale a tratar el grupo como si sus 6 edades fueran aproximadamente 22. Pero en realidad podrían ser, por ejemplo, \(20,\ 21,\ 22,\ 23,\ 24,\ 24\), o alguna otra combinación.
Por eso, la media agrupada:
- usa información resumida,
- pierde detalle respecto de los datos originales,
- y entrega una estimación razonable del promedio.
Ejemplo 3: lectura de una tabla y cálculo completo
La siguiente tabla muestra los tiempos de traslado, en minutos, de 25 estudiantes:
| Intervalo | Marca de clase \(x_i\) | \(f_i\) | \(x_i\cdot f_i\) |
|---|---|---|---|
| \(0{-}9\) | \(4{,}5\) | 4 | 18 |
| \(10{-}19\) | \(14{,}5\) | 8 | 116 |
| \(20{-}29\) | \(24{,}5\) | 7 | 171{,}5 |
| \(30{-}39\) | \(34{,}5\) | 4 | 138 |
| \(40{-}49\) | \(44{,}5\) | 2 | 89 |
| Total | - | 25 | 532{,}5 |
Entonces:
\[ \bar{x}\approx\dfrac{532{,}5}{25}=21{,}3 \]
Interpretación: el tiempo promedio de traslado es aproximadamente \(21{,}3\) minutos.
Ejemplo 4: comparación con datos no agrupados
En datos sueltos, la media se calcula con los valores exactos del conjunto. En cambio, en datos agrupados se usan marcas de clase.
Eso significa que la media agrupada es más rápida de calcular cuando hay muchos datos, pero menos precisa que la media exacta.
| Situación | Tipo de media |
|---|---|
| Se conocen todos los datos exactos | Media exacta |
| Los datos están resumidos en intervalos | Media aproximada |
La media agrupada se usa cuando hay grandes cantidades de datos resumidos en rangos, por ejemplo edades de una población, tiempos de espera, ingresos, estaturas o puntajes. En esos contextos, la tabla permite obtener una estimación útil sin revisar uno por uno todos los valores originales.
En la clase anterior viste que la marca de clase representa el punto medio de cada intervalo. Aquí esa idea se vuelve fundamental, porque cada marca de clase actúa como representante de todo el intervalo al calcular la media agrupada.
Ejercicios de práctica
- Calcula la media aproximada de la tabla con intervalos \(0{-}4,\ 5{-}9,\ 10{-}14\) y frecuencias \(2,\ 5,\ 3\).
- Construye la columna \(x_i\cdot f_i\) para una tabla con marcas de clase \(3,\ 8,\ 13\) y frecuencias \(4,\ 2,\ 1\).
- En una tabla agrupada, las marcas de clase son \(12,\ 17,\ 22\) y las frecuencias son \(3,\ 4,\ 3\). Calcula la media aproximada.
- Explica por qué en datos agrupados la media es una aproximación y no un valor exacto.
- Si la suma \(\sum x_if_i\) es 180 y el total de datos es 12, calcula la media agrupada.
- En una distribución con marcas de clase \(5,\ 15,\ 25,\ 35\) y frecuencias \(2,\ 4,\ 3,\ 1\), calcula la media aproximada.
- Si una tabla tiene intervalos \(10{-}19,\ 20{-}29,\ 30{-}39\), determina sus marcas de clase.
- En una tabla agrupada, el total de frecuencias es 30 y la suma de los productos \(x_if_i\) es 690. ¿Cuál es la media?
- Compara las expresiones “media exacta” y “media aproximada” en el contexto estadístico.
- Una tabla tiene marcas de clase \(4{,}5,\ 14{,}5,\ 24{,}5\) y frecuencias \(6,\ 8,\ 6\). Calcula la media aproximada.
- ¿Qué papel cumple la marca de clase en el cálculo de la media agrupada?
- En una tabla agrupada, ¿qué ocurre con la media aproximada si aumentan las frecuencias de los intervalos altos? Explica brevemente.
- Las marcas de clase son \(2,\ 7,\ 12\).
Entonces: \[ \bar{x}\approx\dfrac{2\cdot 2+7\cdot 5+12\cdot 3}{2+5+3} =\dfrac{4+35+36}{10} =\dfrac{75}{10}=7{,}5 \] - \[ 3\cdot 4=12,\qquad 8\cdot 2=16,\qquad 13\cdot 1=13 \] La columna \(x_i\cdot f_i\) es: \(12,\ 16,\ 13\).
- \[ \bar{x}\approx\dfrac{12\cdot 3+17\cdot 4+22\cdot 3}{3+4+3} =\dfrac{36+68+66}{10} =\dfrac{170}{10}=17 \]
- Porque no se usan los datos originales uno por uno, sino la marca de clase como representante de cada intervalo.
- \[ \bar{x}\approx\dfrac{180}{12}=15 \]
- \[ \bar{x}\approx\dfrac{5\cdot 2+15\cdot 4+25\cdot 3+35\cdot 1}{2+4+3+1} =\dfrac{10+60+75+35}{10} =18 \]
- \[ \dfrac{10+19}{2}=14{,}5,\qquad \dfrac{20+29}{2}=24{,}5,\qquad \dfrac{30+39}{2}=34{,}5 \]
- \[ \bar{x}\approx\dfrac{690}{30}=23 \]
- La media exacta usa todos los datos reales del conjunto. La media aproximada usa marcas de clase porque los datos están agrupados por intervalos.
- \[ \bar{x}\approx\dfrac{4{,}5\cdot 6+14{,}5\cdot 8+24{,}5\cdot 6}{6+8+6} =\dfrac{27+116+147}{20} =\dfrac{290}{20}=14{,}5 \]
- La marca de clase representa el valor central de cada intervalo y se usa como sustituto de los datos reales al calcular la media agrupada.
- La media aproximada tiende a aumentar, porque más datos se concentran en intervalos con marcas de clase más altas.
En preguntas de media agrupada, revisa siempre tres cosas: la marca de clase, el producto \(x_i\cdot f_i\) y el total de frecuencias. Muchos errores aparecen por olvidar uno de esos pasos.
Ejercicios tipo PAES
- En una tabla agrupada, las marcas de clase son \(5,\ 15,\ 25\) y las frecuencias son \(2,\ 3,\ 5\). La media aproximada es:
- \(18\)
- \(20\)
- \(17\)
- \(22\)
- La razón principal por la que la media en datos agrupados se considera una aproximación es que:
- las frecuencias siempre son decimales
- la media no puede calcularse nunca en tablas
- se reemplazan los datos reales por marcas de clase
- los intervalos aparentes y reales son distintos
- Si en una tabla agrupada se tiene \(\sum x_if_i=360\) y \(n=18\), entonces la media aproximada es:
- \(22\)
- \(18\)
- \(20\)
- \(24\)
- Las marcas de clase de los intervalos \(10{-}19,\ 20{-}29,\ 30{-}39\) son:
- \(14,\ 24,\ 34\)
- \(14{,}5,\ 24{,}5,\ 34{,}5\)
- \(15,\ 25,\ 35\)
- \(9{,}5,\ 19{,}5,\ 29{,}5\)
- En una tabla con marcas de clase \(4,\ 8,\ 12\) y frecuencias \(1,\ 3,\ 2\), el valor de \(\sum x_if_i\) es:
- \(40\)
- \(52\)
- \(32\)
- \(28\)
- Si aumentan las frecuencias de los intervalos con mayor marca de clase, entonces es esperable que la media agrupada:
- disminuya
- permanezca igual
- aumente
- desaparezca
- \[ \bar{x}\approx\dfrac{5\cdot 2+15\cdot 3+25\cdot 5}{2+3+5} =\dfrac{10+45+125}{10} =\dfrac{180}{10}=18 \] Respuesta correcta: A
- La media es aproximada porque cada intervalo se representa por su marca de clase en lugar de usar todos los datos exactos.
Respuesta correcta: C - \[ \bar{x}\approx\dfrac{360}{18}=20 \] Respuesta correcta: C
- \[ \dfrac{10+19}{2}=14{,}5,\qquad \dfrac{20+29}{2}=24{,}5,\qquad \dfrac{30+39}{2}=34{,}5 \] Respuesta correcta: B
- \[ \sum x_if_i=4\cdot 1+8\cdot 3+12\cdot 2=4+24+24=52 \] Respuesta correcta: B
- Si hay más datos en intervalos altos, la media tiende a subir.
Respuesta correcta: C
La media en datos agrupados es una herramienta muy útil para resumir distribuciones extensas, pero siempre debe interpretarse como una aproximación. En PAES M1 no basta con aplicar la fórmula: también debes comprender por qué el resultado es estimado y qué información lo sustenta.
7. Mediana en datos agrupados
Mediana en datos agrupados [intervalo mediano, cálculo e interpretación] (PAES M1)
Objetivo de la clase: identificar el intervalo mediano en una tabla de datos agrupados, calcular la mediana mediante interpolación e interpretar su significado dentro de una distribución.
Cuando los datos están agrupados en intervalos, ya no conocemos cada valor exacto del conjunto. Por eso, la mediana no se obtiene observando directamente el dato central, sino estimándola dentro del intervalo mediano.
En esta clase aprenderás no solo a ubicar el intervalo que contiene la mediana, sino también a calcular una aproximación de la mediana usando una fórmula específica para datos agrupados.
La mediana es el valor que divide al conjunto en dos partes: aproximadamente el 50% de los datos queda por debajo y aproximadamente el 50% queda por encima.
En datos agrupados, primero se identifica el intervalo mediano usando la frecuencia acumulada y luego se estima la mediana dentro de ese intervalo.
- Calcula el total de datos \(n\).
- Busca el valor: \[ \dfrac{n}{2} \]
- Observa la frecuencia acumulada y localiza el primer intervalo cuya frecuencia acumulada iguala o supera a \(\dfrac{n}{2}\).
- Ese intervalo es el intervalo mediano.
Una vez identificado el intervalo mediano, la mediana se estima con:
\[ \mathrm{Me}\approx L_i+\left(\dfrac{\frac{n}{2}-F_{anterior}}{f_m}\right)\cdot a \]
donde:
- \(L_i\): límite inferior real del intervalo mediano,
- \(n\): total de datos,
- \(F_{anterior}\): frecuencia acumulada anterior al intervalo mediano,
- \(f_m\): frecuencia del intervalo mediano,
- \(a\): amplitud del intervalo.
Porque dentro del intervalo mediano no conocemos la ubicación exacta de cada dato. La fórmula supone que los datos del intervalo están distribuidos de manera uniforme y, con esa idea, estima dónde se encuentra el valor central.
- Calcula \(\dfrac{n}{2}\).
- Encuentra el intervalo mediano con la frecuencia acumulada.
- Extrae los 4 datos clave: \(L_i\), \(F_{anterior}\), \(f_m\) y \(a\).
- Reemplaza en la fórmula con cuidado.
- Interpreta el resultado dentro del contexto.
Ejemplo 1: encontrar el intervalo mediano
La siguiente tabla resume los tiempos de lectura, en minutos, de 20 estudiantes:
| Intervalo aparente | Intervalo real | \(f\) | \(F\) |
|---|---|---|---|
| \(0{-}9\) | \(-0{,}5 \le x < 9{,}5\) | 3 | 3 |
| \(10{-}19\) | \(9{,}5 \le x < 19{,}5\) | 5 | 8 |
| \(20{-}29\) | \(19{,}5 \le x < 29{,}5\) | 6 | 14 |
| \(30{-}39\) | \(29{,}5 \le x < 39{,}5\) | 4 | 18 |
| \(40{-}49\) | \(39{,}5 \le x < 49{,}5\) | 2 | 20 |
Como el total es \(n=20\), buscamos:
\[ \dfrac{20}{2}=10 \]
La frecuencia acumulada pasa de 8 a 14 en el intervalo \(20{-}29\), por lo tanto ese es el intervalo mediano.
Ejemplo 2: cálculo de la mediana agrupada
Usamos la tabla anterior.
Ya sabemos que el intervalo mediano es \(20{-}29\), cuyo intervalo real es:
\[ 19{,}5 \le x < 29{,}5 \]
Entonces identificamos los datos de la fórmula:
- \(L_i=19{,}5\)
- \(n=20\)
- \(\dfrac{n}{2}=10\)
- \(F_{anterior}=8\)
- \(f_m=6\)
- \(a=10\)
Reemplazamos:
\[ \mathrm{Me}\approx 19{,}5+\left(\dfrac{10-8}{6}\right)\cdot 10 \]
\[ \mathrm{Me}\approx 19{,}5+\left(\dfrac{2}{6}\right)\cdot 10 \]
\[ \mathrm{Me}\approx 19{,}5+3{,}33 \]
\[ \mathrm{Me}\approx 22{,}83 \]
Conclusión: la mediana es aproximadamente \(22{,}83\) minutos.
Ejemplo 3: interpretación de la mediana
El valor \(\mathrm{Me}\approx 22{,}83\) indica que aproximadamente la mitad de los estudiantes tiene tiempos de lectura menores que \(22{,}83\) minutos, y la otra mitad tiene tiempos mayores.
Como se trata de datos agrupados, este valor es una estimación del centro de la distribución.
Ejemplo 4: otro cálculo completo
Observa la siguiente tabla de estaturas de 30 estudiantes:
| Intervalo aparente | Intervalo real | \(f\) | \(F\) |
|---|---|---|---|
| \(140{-}149\) | \(139{,}5 \le x < 149{,}5\) | 3 | 3 |
| \(150{-}159\) | \(149{,}5 \le x < 159{,}5\) | 8 | 11 |
| \(160{-}169\) | \(159{,}5 \le x < 169{,}5\) | 10 | 21 |
| \(170{-}179\) | \(169{,}5 \le x < 179{,}5\) | 6 | 27 |
| \(180{-}189\) | \(179{,}5 \le x < 189{,}5\) | 3 | 30 |
Primero calculamos:
\[ \dfrac{30}{2}=15 \]
La frecuencia acumulada pasa de 11 a 21 en el intervalo \(160{-}169\), por lo tanto ese es el intervalo mediano.
Ahora extraemos los datos:
- \(L_i=159{,}5\)
- \(F_{anterior}=11\)
- \(f_m=10\)
- \(a=10\)
Aplicamos la fórmula:
\[ \mathrm{Me}\approx 159{,}5+\left(\dfrac{15-11}{10}\right)\cdot 10 \]
\[ \mathrm{Me}\approx 159{,}5+4 \]
\[ \mathrm{Me}\approx 163{,}5 \]
Interpretación: la estatura mediana es aproximadamente \(163{,}5\) cm.
- Confundir el intervalo mediano con el intervalo modal.
- Usar el límite inferior aparente en vez del límite inferior real.
- Tomar \(F\) del intervalo mediano en lugar de usar la frecuencia acumulada anterior.
- Usar mal la amplitud del intervalo.
- Creer que la mediana agrupada es exacta y no una aproximación.
La mediana permite ubicar el centro de una distribución aun cuando los datos estén resumidos en intervalos. Es especialmente útil cuando interesa describir un valor central sin dejarse influir demasiado por valores extremos.
En datos sueltos, la mediana se encuentra buscando el dato central del conjunto ordenado. En datos agrupados, esa idea se mantiene, pero ahora el centro se estima dentro del intervalo mediano usando una interpolación.
Ejercicios de práctica
- En una tabla agrupada con \(n=40\), ¿qué valor debes calcular primero para buscar la mediana?
- Explica qué es el intervalo mediano.
- Si en una tabla el intervalo mediano tiene \(L_i=29{,}5\), \(F_{anterior}=12\), \(f_m=8\), \(a=10\) y \(n=40\), calcula la mediana.
- En una distribución con \(n=50\), si la frecuencia acumulada anterior al intervalo mediano es 18 y la frecuencia del intervalo mediano es 12, con \(L_i=39{,}5\) y \(a=10\), calcula la mediana.
- ¿Por qué en la fórmula se usa la frecuencia acumulada anterior y no la del propio intervalo mediano?
- En una tabla agrupada, la mediana quedó aproximadamente en \(24{,}7\). Interpreta ese resultado.
- Si el intervalo mediano es \(60{-}69\), con intervalo real \(59{,}5 \le x < 69{,}5\), frecuencia 15, acumulada anterior 20, total 70 y amplitud 10, calcula la mediana.
- Explica por qué la mediana agrupada es una aproximación.
- ¿Qué ocurre con la mediana si el valor \(\dfrac{n}{2}\) cae exactamente al inicio de un intervalo?
- ¿Qué papel cumple la amplitud del intervalo en la fórmula de la mediana agrupada?
- En una tabla, \(n=24\), \(L_i=19{,}5\), \(F_{anterior}=9\), \(f_m=6\), \(a=10\). Calcula la mediana.
- Diferencia con tus palabras “encontrar el intervalo mediano” y “calcular la mediana agrupada”.
- Se calcula: \[ \dfrac{40}{2}=20 \]
- Es el intervalo cuya frecuencia acumulada es la primera que iguala o supera a \(\dfrac{n}{2}\), es decir, el intervalo donde se encuentra la posición central.
- \[ \mathrm{Me}\approx 29{,}5+\left(\dfrac{20-12}{8}\right)\cdot 10 \] \[ \mathrm{Me}\approx 29{,}5+10 \] \[ \mathrm{Me}\approx 39{,}5 \]
- \[ \mathrm{Me}\approx 39{,}5+\left(\dfrac{25-18}{12}\right)\cdot 10 \] \[ \mathrm{Me}\approx 39{,}5+\dfrac{70}{12} \] \[ \mathrm{Me}\approx 39{,}5+5{,}83 \] \[ \mathrm{Me}\approx 45{,}33 \]
- Porque esa frecuencia indica cuántos datos se han acumulado antes de entrar al intervalo mediano, y permite ubicar cuánto falta avanzar dentro de él para llegar al 50%.
- Significa que aproximadamente la mitad de los datos es menor que \(24{,}7\) y la otra mitad es mayor que ese valor.
- \[ \dfrac{70}{2}=35 \] \[ \mathrm{Me}\approx 59{,}5+\left(\dfrac{35-20}{15}\right)\cdot 10 \] \[ \mathrm{Me}\approx 59{,}5+10 \] \[ \mathrm{Me}\approx 69{,}5 \]
- Porque no conocemos los datos exactos dentro de cada intervalo, solo sus frecuencias. La fórmula estima dónde está el centro suponiendo una distribución uniforme dentro del intervalo mediano.
- Que la mediana coincide con el límite inferior real de ese intervalo.
- La amplitud indica cuánto “ancho” tiene el intervalo y permite estimar qué parte de ese ancho hay que recorrer para llegar a la mediana.
- \[ \dfrac{24}{2}=12 \] \[ \mathrm{Me}\approx 19{,}5+\left(\dfrac{12-9}{6}\right)\cdot 10 \] \[ \mathrm{Me}\approx 19{,}5+5 \] \[ \mathrm{Me}\approx 24{,}5 \]
- Encontrar el intervalo mediano es identificar la clase donde está el centro de la distribución. Calcular la mediana agrupada es estimar un valor específico dentro de ese intervalo usando la fórmula.
En ejercicios de mediana agrupada, separa mentalmente el proceso en dos partes: primero ubicar el intervalo mediano y luego reemplazar correctamente los datos en la fórmula.
Ejercicios tipo PAES
- En una tabla agrupada con \(n=32\), el valor que se busca primero para localizar la mediana es:
- \(8\)
- \(32\)
- \(16\)
- \(15\)
- La fórmula de la mediana agrupada usa:
- el límite inferior real del intervalo mediano
- la marca de clase del intervalo modal
- la frecuencia relativa acumulada final
- el límite superior aparente del primer intervalo
- Si \(n=40\), \(L_i=19{,}5\), \(F_{anterior}=14\), \(f_m=10\) y \(a=10\), la mediana es:
- \(23{,}5\)
- \(25{,}5\)
- \(29{,}5\)
- \(20{,}5\)
- El intervalo mediano es el primer intervalo cuya frecuencia acumulada:
- es menor que \(\dfrac{n}{2}\)
- supera o iguala a \(\dfrac{n}{2}\)
- coincide con la frecuencia simple mayor
- es exactamente igual a 1
- Si en una tabla agrupada la mediana estimada es \(54{,}2\), entonces:
- ese valor necesariamente aparece en los datos originales
- el 54,2% de los datos está bajo ese valor
- aproximadamente la mitad de los datos queda por debajo de ese valor
- la media debe ser igual a 54,2
- En la fórmula de la mediana agrupada, \(F_{anterior}\) representa:
- la frecuencia del intervalo mediano
- la frecuencia acumulada anterior al intervalo mediano
- la frecuencia relativa del último intervalo
- la suma de todas las frecuencias
- \[ \dfrac{32}{2}=16 \] Respuesta correcta: C
- La fórmula usa el límite inferior real del intervalo mediano.
Respuesta correcta: A - \[ \mathrm{Me}\approx 19{,}5+\left(\dfrac{20-14}{10}\right)\cdot 10 \] \[ \mathrm{Me}\approx 19{,}5+6 \] \[ \mathrm{Me}\approx 25{,}5 \] Respuesta correcta: B
- El intervalo mediano es el primero cuya frecuencia acumulada iguala o supera a \(\dfrac{n}{2}\).
Respuesta correcta: B - La interpretación correcta de la mediana es que aproximadamente la mitad de los datos queda por debajo y la otra mitad por encima.
Respuesta correcta: C - \(F_{anterior}\) es la frecuencia acumulada anterior al intervalo mediano.
Respuesta correcta: B
En datos agrupados, la mediana no se limita a ubicar un intervalo: también puede estimarse numéricamente mediante una fórmula. Para responder bien en PAES M1, debes distinguir entre encontrar el intervalo mediano e interpolar dentro de él para obtener la mediana aproximada.
8. Moda en datos agrupados
Moda en datos agrupados [clase modal, fórmula, estimación] (PAES M1)
Objetivo de la clase: identificar la clase modal en una tabla de datos agrupados, estimar la moda mediante una fórmula e interpretar su significado dentro de una distribución.
Cuando los datos están agrupados por intervalos, ya no podemos ver con exactitud cuál es el valor que más se repite. En ese caso, primero identificamos la clase modal, es decir, el intervalo con mayor frecuencia, y luego estimamos la moda usando una fórmula.
En esta clase aprenderás a reconocer la clase modal, a aplicar la fórmula de la moda en datos agrupados y a interpretar el resultado como una estimación del valor más representativo en la zona de mayor concentración de datos.
La moda es el valor que aparece con mayor frecuencia. En datos agrupados, como no conocemos los datos exactos uno a uno, no siempre podemos hallar la moda exacta, pero sí podemos identificar la clase modal y estimar un valor modal dentro de ella.
- Observa la columna de frecuencia absoluta \(f\).
- Busca el intervalo con mayor frecuencia.
- Ese intervalo se llama clase modal.
Una vez identificada la clase modal, la moda se estima con:
\[ \mathrm{Mo}\approx L_i+\left(\dfrac{d_1}{d_1+d_2}\right)\cdot a \]
donde:
- \(L_i\): límite inferior real de la clase modal,
- \(a\): amplitud del intervalo modal,
- \(d_1=f_m-f_{anterior}\): diferencia entre la frecuencia modal y la frecuencia anterior,
- \(d_2=f_m-f_{siguiente}\): diferencia entre la frecuencia modal y la frecuencia siguiente,
- \(f_m\): frecuencia de la clase modal.
Porque la tabla no muestra exactamente cómo se distribuyen los datos dentro de la clase modal. La fórmula usa las frecuencias vecinas para estimar en qué parte del intervalo se concentra más fuertemente la distribución.
- Encuentra la clase modal mirando la frecuencia mayor.
- Identifica \(L_i\) y la amplitud \(a\).
- Calcula \(d_1\) y \(d_2\) comparando la frecuencia modal con la anterior y la siguiente.
- Reemplaza con cuidado en la fórmula.
- Interpreta el resultado como una aproximación del valor más frecuente.
Ejemplo 1: identificar la clase modal
La siguiente tabla resume los tiempos de práctica, en minutos, de 30 estudiantes:
| Intervalo aparente | Intervalo real | \(f\) |
|---|---|---|
| \(0{-}9\) | \(-0{,}5 \le x < 9{,}5\) | 4 |
| \(10{-}19\) | \(9{,}5 \le x < 19{,}5\) | 7 |
| \(20{-}29\) | \(19{,}5 \le x < 29{,}5\) | 10 |
| \(30{-}39\) | \(29{,}5 \le x < 39{,}5\) | 6 |
| \(40{-}49\) | \(39{,}5 \le x < 49{,}5\) | 3 |
La frecuencia mayor es \(10\), que corresponde al intervalo \(20{-}29\).
Conclusión: la clase modal es \(20{-}29\).
Ejemplo 2: cálculo de la moda agrupada
Usamos la tabla anterior.
La clase modal es \(20{-}29\), cuyo intervalo real es:
\[ 19{,}5 \le x < 29{,}5 \]
Entonces:
- \(L_i=19{,}5\)
- \(a=10\)
- \(f_m=10\)
- \(f_{anterior}=7\)
- \(f_{siguiente}=6\)
Calculamos las diferencias:
\[ d_1=10-7=3 \]
\[ d_2=10-6=4 \]
Ahora reemplazamos en la fórmula:
\[ \mathrm{Mo}\approx 19{,}5+\left(\dfrac{3}{3+4}\right)\cdot 10 \]
\[ \mathrm{Mo}\approx 19{,}5+\left(\dfrac{3}{7}\right)\cdot 10 \]
\[ \mathrm{Mo}\approx 19{,}5+4{,}29 \]
\[ \mathrm{Mo}\approx 23{,}79 \]
Conclusión: la moda estimada es aproximadamente \(23{,}79\) minutos.
Ejemplo 3: interpretación de la moda agrupada
El valor \(\mathrm{Mo}\approx 23{,}79\) indica que el punto de mayor concentración de datos está aproximadamente cerca de \(23{,}79\) minutos.
Eso no significa que ese valor aparezca exactamente en la tabla original, sino que representa una estimación del valor más frecuente dentro de la zona modal.
Ejemplo 4: otro cálculo completo
Observa la siguiente tabla de estaturas de 40 estudiantes:
| Intervalo aparente | Intervalo real | \(f\) |
|---|---|---|
| \(140{-}149\) | \(139{,}5 \le x < 149{,}5\) | 5 |
| \(150{-}159\) | \(149{,}5 \le x < 159{,}5\) | 11 |
| \(160{-}169\) | \(159{,}5 \le x < 169{,}5\) | 14 |
| \(170{-}179\) | \(169{,}5 \le x < 179{,}5\) | 7 |
| \(180{-}189\) | \(179{,}5 \le x < 189{,}5\) | 3 |
La mayor frecuencia es \(14\), así que la clase modal es \(160{-}169\).
Identificamos los datos:
- \(L_i=159{,}5\)
- \(a=10\)
- \(f_m=14\)
- \(f_{anterior}=11\)
- \(f_{siguiente}=7\)
Calculamos:
\[ d_1=14-11=3 \]
\[ d_2=14-7=7 \]
Aplicamos la fórmula:
\[ \mathrm{Mo}\approx 159{,}5+\left(\dfrac{3}{3+7}\right)\cdot 10 \]
\[ \mathrm{Mo}\approx 159{,}5+3 \]
\[ \mathrm{Mo}\approx 162{,}5 \]
Interpretación: la estatura modal estimada es aproximadamente \(162{,}5\) cm.
Ejemplo 5: comparación entre clase modal y moda estimada
La clase modal solo indica en qué intervalo está la mayor concentración de datos.
La moda estimada, en cambio, intenta ubicar un valor específico dentro de ese intervalo.
| Concepto | Qué indica |
|---|---|
| Clase modal | El intervalo con mayor frecuencia |
| Moda estimada | Un valor aproximado de máxima concentración dentro de ese intervalo |
- Confundir la clase modal con el intervalo mediano.
- Usar el límite inferior aparente en vez del límite inferior real.
- Calcular mal \(d_1\) y \(d_2\).
- Creer que la moda estimada es exacta.
- Olvidar que la clase modal debe compararse con la frecuencia anterior y con la siguiente.
La moda agrupada ayuda a identificar la zona donde los datos se concentran con mayor fuerza. Esto es útil en contextos como tallas, edades, tiempos o puntajes, cuando interesa reconocer el tramo más frecuente de la distribución y estimar un valor representativo dentro de él.
En datos sueltos, la moda es el valor que más se repite. En datos agrupados, esa idea se transforma en dos pasos: primero se localiza la clase modal y luego se estima la moda usando las frecuencias vecinas para ubicar mejor el punto de máxima concentración.
Ejercicios de práctica
- Explica qué es la clase modal en una tabla de datos agrupados.
- En una tabla, las frecuencias son \(4,\ 9,\ 12,\ 7,\ 3\). ¿Cuál es la clase modal?
- Si una clase modal tiene \(f_m=15\), la frecuencia anterior es 11 y la siguiente es 9, calcula \(d_1\) y \(d_2\).
- En un intervalo modal con límite inferior real \(29{,}5\), amplitud 10, \(d_1=4\) y \(d_2=6\), calcula la moda estimada.
- Explica por qué la moda agrupada es una estimación y no un valor exacto.
- Si la clase modal es \(50{-}59\), su intervalo real es \(49{,}5 \le x < 59{,}5\), \(f_m=18\), \(f_{anterior}=12\) y \(f_{siguiente}=10\), calcula la moda.
- ¿Qué diferencia hay entre clase modal y moda estimada?
- En una tabla agrupada, si la frecuencia anterior y la siguiente a la clase modal son iguales, ¿qué ocurre con la fracción \(\dfrac{d_1}{d_1+d_2}\)?
- Si \(L_i=19{,}5\), \(a=10\), \(f_m=14\), \(f_{anterior}=10\), \(f_{siguiente}=12\), calcula la moda estimada.
- Interpreta una moda agrupada aproximada de \(72{,}4\).
- En una tabla, ¿por qué no basta con saber solo la frecuencia modal para calcular la moda agrupada?
- ¿Qué papel cumplen las frecuencias vecinas en la fórmula de la moda agrupada?
- Es el intervalo que tiene la mayor frecuencia absoluta dentro de la tabla.
- La clase modal es la tercera clase, porque tiene frecuencia \(12\), que es la mayor.
- \[ d_1=15-11=4,\qquad d_2=15-9=6 \]
- \[ \mathrm{Mo}\approx 29{,}5+\left(\dfrac{4}{4+6}\right)\cdot 10 \] \[ \mathrm{Mo}\approx 29{,}5+4 \] \[ \mathrm{Mo}\approx 33{,}5 \]
- Porque dentro del intervalo modal no conocemos la distribución exacta de los datos. La fórmula solo estima dónde está la mayor concentración.
- \[ d_1=18-12=6,\qquad d_2=18-10=8 \] \[ \mathrm{Mo}\approx 49{,}5+\left(\dfrac{6}{6+8}\right)\cdot 10 \] \[ \mathrm{Mo}\approx 49{,}5+\left(\dfrac{6}{14}\right)\cdot 10 \] \[ \mathrm{Mo}\approx 49{,}5+4{,}29 \] \[ \mathrm{Mo}\approx 53{,}79 \]
- La clase modal es el intervalo con mayor frecuencia. La moda estimada es un valor aproximado dentro de ese intervalo.
- Si son iguales, entonces \(d_1=d_2\) y la fracción vale \(\dfrac{1}{2}\), por lo que la moda queda en el centro del intervalo modal.
- \[ d_1=14-10=4,\qquad d_2=14-12=2 \] \[ \mathrm{Mo}\approx 19{,}5+\left(\dfrac{4}{4+2}\right)\cdot 10 \] \[ \mathrm{Mo}\approx 19{,}5+\dfrac{4}{6}\cdot 10 \] \[ \mathrm{Mo}\approx 19{,}5+6{,}67 \] \[ \mathrm{Mo}\approx 26{,}17 \]
- Significa que la zona de mayor concentración de datos está alrededor de \(72{,}4\), por lo que ese valor representa aproximadamente el dato más frecuente de la distribución.
- Porque la fórmula necesita comparar la clase modal con las frecuencias vecinas para estimar en qué parte del intervalo está la mayor concentración.
- Permiten medir hacia qué lado del intervalo modal se concentra más la distribución y, con eso, ajustar la estimación de la moda.
En ejercicios de moda agrupada, separa el proceso en tres partes: primero identifica la clase modal, después calcula bien \(d_1\) y \(d_2\), y recién entonces reemplaza en la fórmula.
Ejercicios tipo PAES
- En una tabla agrupada, la clase modal es:
- la que contiene la mediana
- la que tiene mayor amplitud
- la que tiene mayor frecuencia
- la última clase de la tabla
- En la fórmula de la moda agrupada, \(d_1\) representa:
- la diferencia entre la frecuencia modal y la frecuencia anterior
- la suma de las dos frecuencias vecinas
- la amplitud del intervalo modal
- la marca de clase modal
- Si \(L_i=39{,}5\), \(a=10\), \(f_m=18\), \(f_{anterior}=14\) y \(f_{siguiente}=12\), la moda estimada es:
- \(43{,}5\)
- \(45{,}5\)
- \(44{,}5\)
- \(46{,}17\)
- La moda en datos agrupados se considera una estimación porque:
- la frecuencia siempre es decimal
- se desconoce la distribución exacta de los datos dentro del intervalo modal
- la clase modal coincide siempre con la mediana
- no existe límite inferior real
- Si en una tabla agrupada la clase modal tiene frecuencias vecinas iguales, entonces la moda estimada queda:
- al inicio del intervalo modal
- en el centro del intervalo modal
- fuera del intervalo modal
- en el límite superior real del intervalo siguiente
- En la fórmula de la moda agrupada, el valor \(a\) representa:
- la frecuencia acumulada anterior
- la amplitud del intervalo modal
- la suma de frecuencias
- la cantidad total de clases
- La clase modal es la que tiene mayor frecuencia.
Respuesta correcta: C - \(d_1\) es la diferencia entre la frecuencia modal y la frecuencia anterior.
Respuesta correcta: A - \[ d_1=18-14=4,\qquad d_2=18-12=6 \] \[ \mathrm{Mo}\approx 39{,}5+\left(\dfrac{4}{4+6}\right)\cdot 10 \] \[ \mathrm{Mo}\approx 39{,}5+4 \] \[ \mathrm{Mo}\approx 43{,}5 \] Respuesta correcta: A
- La moda es una estimación porque no conocemos cómo se distribuyen exactamente los datos dentro del intervalo modal.
Respuesta correcta: B - Si las frecuencias vecinas son iguales, entonces \(d_1=d_2\), por lo que la moda queda en el centro del intervalo modal.
Respuesta correcta: B - En la fórmula, \(a\) representa la amplitud del intervalo modal.
Respuesta correcta: B
En datos agrupados, la moda no se limita a ubicar la clase de mayor frecuencia. También puede estimarse numéricamente usando una fórmula que considera la clase modal y sus frecuencias vecinas. Para responder bien en PAES M1, debes distinguir entre reconocer la clase modal e interpretar la moda estimada como una aproximación del valor más frecuente.
9. Comparación entre medidas centrales [datos sueltos vs agrupados, pérdida de información]
Comparación entre medidas centrales [datos sueltos vs agrupados, pérdida de información] (PAES M1)
Objetivo de la clase: comparar la media, la mediana y la moda en datos sueltos, en tablas de frecuencias simples y en datos agrupados por intervalos, reconociendo cómo cambia la precisión de las medidas cuando la información se resume.
Hasta ahora has aprendido a calcular media, mediana y moda en distintos formatos: datos sueltos, tablas de frecuencia simple y datos agrupados por intervalos. En esta clase el foco estará en comparar qué ocurre cuando una misma información se organiza de maneras distintas.
La idea central es importante: mientras más se resume la información, más fácil puede ser analizarla, pero también se pierde detalle. Por eso, en datos agrupados por intervalos, las medidas centrales suelen ser aproximadas.
No es lo mismo trabajar con datos sueltos, con una tabla de frecuencias simple o con datos agrupados en intervalos. En los datos sueltos conservamos toda la información original. En una tabla simple seguimos teniendo exactitud, pero la información ya está resumida. En datos agrupados, en cambio, ganamos orden y rapidez de lectura, pero perdemos precisión, porque reemplazamos muchos datos por intervalos y marcas de clase.
En los ejercicios con intervalos distinguiremos entre intervalo aparente e intervalo real. Por ejemplo, el intervalo aparente \(50{-}59\) corresponde al intervalo real \(49{,}5 \le x < 59{,}5\).
Media en tabla de frecuencias simple:
\[ \bar{x}=\frac{\sum x_i f_i}{\sum f_i} \]
Media en datos agrupados:
\[ \bar{x}\approx\frac{\sum f_i x_i}{\sum f_i} \]
Mediana en datos agrupados:
\[ Me \approx L_i+\left(\frac{\frac{N}{2}-F_{anterior}}{f_m}\right)a \]
Moda en datos agrupados:
\[ Mo \approx L_i+\left(\frac{d_1}{d_1+d_2}\right)a \]
- Si el valor obtenido es exacto o aproximado.
- Si la medida conserva bien el centro del conjunto.
- Qué información se pierde al pasar de datos sueltos a intervalos.
- Qué ventaja se gana al resumir muchos datos en una tabla.
Ejemplo guiado: misma información, distinto nivel de resumen
Considera los siguientes datos sueltos:
\[ 2,\ 3,\ 1,\ 4,\ 2,\ 5,\ 3,\ 2,\ 4,\ 1,\ 3,\ 2 \]
Si trabajamos con los datos sueltos:
- podemos ordenarlos,
- identificar exactamente el dato central,
- y reconocer con precisión el valor más frecuente.
Ordenando:
\[ 1,\ 1,\ 2,\ 2,\ 2,\ 2,\ 3,\ 3,\ 3,\ 4,\ 4,\ 5 \]
Moda: \(2\)
Mediana: como hay 12 datos, se promedian el 6.° y el 7.°:
\[ Me=\frac{2+3}{2}=2{,}5 \]
Media:
\[ \bar{x}=\frac{2+3+1+4+2+5+3+2+4+1+3+2}{12}=\frac{32}{12}\approx 2{,}67 \]
Si ahora construimos una tabla de frecuencia simple, las medidas siguen siendo exactas, porque no hemos perdido los valores originales: solo los hemos resumido.
Si agrupamos en intervalos, por ejemplo \(1{-}2\), \(3{-}4\), \(5{-}6\), entonces ya no trabajamos con cada dato exacto, sino con grupos de datos. Ahí las medidas dejan de ser exactas y pasan a ser estimaciones.
Ejercicio 1: desde datos sueltos a tabla de frecuencias simple
En un curso se registró cuántos mensajes enviaron los estudiantes durante un día. Los resultados fueron:
\[ 2,\ 3,\ 1,\ 4,\ 2,\ 5,\ 3,\ 2,\ 4,\ 1,\ 3,\ 2,\ 6,\ 4,\ 3,\ 2,\ 5,\ 3,\ 4,\ 2,\ 1,\ 3,\ 2,\ 4,\ 3 \]
Desarrolla lo siguiente:
- Ordena los datos.
- Construye una tabla de frecuencias con los datos dados.
- Calcula la media.
- Determina la moda.
- Determina la mediana usando la frecuencia acumulada.
- Compara las medidas obtenidas desde los datos sueltos y desde la tabla. ¿Cambian o no cambian?
| Número de mensajes \(x_i\) | Frecuencia \(f_i\) | \(x_i \cdot f_i\) | Frecuencia acumulada |
|---|---|---|---|
| 1 | |||
| 2 | |||
| 3 | |||
| 4 | |||
| 5 | |||
| 6 | |||
| Total |
Luego responde:
- ¿Cuál es el valor que más se repite?
- ¿Cuál es el dato central del conjunto?
- ¿Qué información aporta la frecuencia acumulada para hallar la mediana?
- ¿Se perdió información al pasar de los datos sueltos a la tabla simple?
- Datos ordenados:
\[ 1,\ 1,\ 1,\ 2,\ 2,\ 2,\ 2,\ 2,\ 2,\ 2,\ 3,\ 3,\ 3,\ 3,\ 3,\ 3,\ 3,\ 4,\ 4,\ 4,\ 4,\ 4,\ 5,\ 5,\ 6 \] - Tabla completa:
\(x_i\) \(f_i\) \(x_i \cdot f_i\) Frecuencia acumulada 1 3 3 3 2 7 14 10 3 7 21 17 4 5 20 22 5 2 10 24 6 1 6 25 Total 25 74 25 - Media: \[ \bar{x}=\frac{74}{25}=2{,}96 \]
- Moda: los valores de mayor frecuencia son \(2\) y \(3\), porque ambos aparecen 7 veces.
El conjunto es bimodal. - Mediana: como hay 25 datos, la posición central es: \[ \frac{25+1}{2}=13 \] La frecuencia acumulada llega a 10 en el valor 2 y a 17 en el valor 3, por lo tanto el dato 13 corresponde a \(3\).
\[ Me=3 \] - Las medidas obtenidas desde los datos sueltos y desde la tabla simple no cambian, porque la tabla simple solo resume la información exacta.
- Los valores que más se repiten son \(2\) y \(3\).
- El dato central es \(3\).
- La frecuencia acumulada permite ubicar la posición central sin tener que reescribir todos los datos ordenados.
- No se pierde información esencial, porque seguimos trabajando con los mismos valores exactos, solo más organizados.
Ejercicio 2: agrupar los mismos datos y comparar las medidas
Usa los mismos datos del ejercicio anterior, pero ahora agrúpalos en los siguientes intervalos:
\[ 1{-}2,\qquad 3{-}4,\qquad 5{-}6 \]
Desarrolla lo siguiente:
- Completa la tabla de frecuencias agrupadas.
- Escribe los intervalos reales.
- Calcula la marca de clase de cada intervalo.
- Calcula la media agrupada.
- Determina la mediana agrupada.
- Determina la moda agrupada.
- Compara estos resultados con los obtenidos en el ejercicio 1.
| Intervalo aparente | Intervalo real | Marca de clase \(x_i\) | Frecuencia \(f_i\) | \(f_i \cdot x_i\) | Frecuencia acumulada |
|---|---|---|---|---|---|
| \(1{-}2\) | |||||
| \(3{-}4\) | |||||
| \(5{-}6\) | |||||
| Total |
Luego responde:
- ¿Cuál es la clase modal?
- ¿Cuál es la clase mediana?
- ¿La media agrupada coincide exactamente con la media de los datos sueltos?
- ¿Qué información se perdió al agrupar?
- ¿Qué ocurrió con la moda al pasar de datos sueltos a datos agrupados?
- Tabla completa:
Intervalo aparente Intervalo real Marca de clase \(x_i\) \(f_i\) \(f_i\cdot x_i\) Frecuencia acumulada \(1{-}2\) \(0{,}5 \le x < 2{,}5\) \(1{,}5\) 10 15 10 \(3{-}4\) \(2{,}5 \le x < 4{,}5\) \(3{,}5\) 12 42 22 \(5{-}6\) \(4{,}5 \le x < 6{,}5\) \(5{,}5\) 3 16{,}5 25 Total 25 73{,}5 25 - Media agrupada: \[ \bar{x}\approx \frac{73{,}5}{25}=2{,}94 \]
- Mediana agrupada:
Como \(n=25\), \[ \frac{25}{2}=12{,}5 \] La clase mediana es \(3{-}4\), porque la frecuencia acumulada pasa de 10 a 22. \[ Me \approx 2{,}5+\left(\frac{12{,}5-10}{12}\right)\cdot 2 \] \[ Me \approx 2{,}5+\frac{2{,}5}{12}\cdot 2 \] \[ Me \approx 2{,}92 \] - Moda agrupada:
La clase modal es \(3{-}4\), porque tiene la mayor frecuencia: \(12\). \[ d_1=12-10=2,\qquad d_2=12-3=9 \] \[ Mo\approx 2{,}5+\left(\frac{2}{2+9}\right)\cdot 2 \] \[ Mo\approx 2{,}5+\frac{4}{11} \] \[ Mo\approx 2{,}86 \] - La clase modal es \(3{-}4\).
- La clase mediana es \(3{-}4\).
- No, la media agrupada no coincide exactamente: se aproxima a la media real.
- Se perdió el detalle exacto de cada dato individual. Ahora solo sabemos cuántos datos hay dentro de cada intervalo.
- En los datos sueltos la moda era bimodal (\(2\) y \(3\)). Al agrupar, esa información fina se pierde y aparece una sola clase modal, \(3{-}4\). Esta es una muestra clara de pérdida de información.
Al agrupar datos, la interpretación de la moda puede cambiar bastante. En este caso, los datos sueltos son bimodales, pero al agrupar se obtiene una única clase modal. Esto muestra que agrupar facilita el análisis, pero puede ocultar detalles importantes del conjunto original.
Ejercicio 3: segundo caso de datos agrupados
Los siguientes puntajes corresponden a 24 estudiantes en una prueba:
\[ 52,\ 64,\ 66,\ 68,\ 69,\ 70,\ 72,\ 72,\ 73,\ 74,\ 75,\ 75,\ 76,\ 77,\ 78,\ 78,\ 79,\ 80,\ 82,\ 84,\ 85,\ 88,\ 90,\ 92 \]
Desarrolla lo siguiente:
- Agrupa los datos en los intervalos dados.
- Completa la columna de intervalo real.
- Calcula la marca de clase de cada intervalo.
- Completa la frecuencia, el producto \(f_i \cdot x_i\) y la frecuencia acumulada.
- Calcula la media agrupada.
- Determina la mediana agrupada.
- Determina la moda agrupada.
- Explica por qué estas tres medidas son aproximadas.
| Intervalo aparente | Intervalo real | Marca de clase \(x_i\) | Frecuencia \(f_i\) | \(f_i \cdot x_i\) | Frecuencia acumulada |
|---|---|---|---|---|---|
| 50–59 | |||||
| 60–69 | |||||
| 70–79 | |||||
| 80–89 | |||||
| 90–99 | |||||
| Total |
Luego responde:
- ¿Cuál es la clase mediana?
- ¿Cuál es la clase modal?
- ¿Qué diferencia observas entre intervalo aparente e intervalo real?
- ¿Por qué la media agrupada no coincide necesariamente con la media real de los datos?
- Tabla completa:
Intervalo aparente Intervalo real Marca de clase \(x_i\) \(f_i\) \(f_i\cdot x_i\) Frecuencia acumulada 50–59 \(49{,}5 \le x < 59{,}5\) \(54{,}5\) 1 54{,}5 1 60–69 \(59{,}5 \le x < 69{,}5\) \(64{,}5\) 4 258 5 70–79 \(69{,}5 \le x < 79{,}5\) \(74{,}5\) 12 894 17 80–89 \(79{,}5 \le x < 89{,}5\) \(84{,}5\) 5 422{,}5 22 90–99 \(89{,}5 \le x < 99{,}5\) \(94{,}5\) 2 189 24 Total 24 1818 24 - Media agrupada: \[ \bar{x}\approx \frac{1818}{24}=75{,}75 \]
- Mediana agrupada:
\[ \frac{24}{2}=12 \] La clase mediana es \(70{-}79\), porque la frecuencia acumulada pasa de 5 a 17. \[ Me\approx 69{,}5+\left(\frac{12-5}{12}\right)\cdot 10 \] \[ Me\approx 69{,}5+5{,}83 \] \[ Me\approx 75{,}33 \] - Moda agrupada:
La clase modal es \(70{-}79\), porque tiene frecuencia 12. \[ d_1=12-4,\qquad d_2=12-5 \] \[ d_1=8,\qquad d_2=7 \] \[ Mo\approx 69{,}5+\left(\frac{8}{8+7}\right)\cdot 10 \] \[ Mo\approx 69{,}5+5{,}33 \] \[ Mo\approx 74{,}83 \] - La clase mediana es \(70{-}79\).
- La clase modal es \(70{-}79\).
- El intervalo aparente es el que se escribe en la tabla, mientras que el real ajusta los límites para representar correctamente la continuidad de los datos.
- Porque la media agrupada usa marcas de clase en lugar de los valores exactos originales.
En estudios reales, muchas veces no se trabaja con los datos exactos, sino con tablas resumidas o con intervalos. Eso permite analizar grandes cantidades de información, pero obliga a aceptar que algunas medidas ya no son exactas. Comprender esa diferencia es clave para interpretar bien promedios, medianas y modas en contextos reales.
Cierre y reflexión
- ¿Qué diferencia hay entre trabajar con datos sueltos, una tabla de frecuencias simple y una tabla agrupada en intervalos?
- ¿En cuál de esas tres formas se conserva mejor la información original?
- ¿En cuál de esas tres formas es más exacto el cálculo de la media, la moda y la mediana?
- ¿Por qué se dice que en datos agrupados las medidas son aproximadas?
- ¿Qué ventaja tiene, a pesar de eso, trabajar con datos agrupados cuando hay muchos valores?
- En los datos sueltos se conserva toda la información exacta. En la tabla simple la información se resume, pero sigue siendo exacta. En los datos agrupados se organiza más, pero se pierde detalle al trabajar con intervalos.
- En los datos sueltos.
- En los datos sueltos y en la tabla de frecuencias simple, porque ambos conservan la exactitud de los valores.
- Porque ya no se trabaja con cada dato exacto, sino con intervalos y marcas de clase, lo que obliga a estimar.
- Permite resumir y analizar grandes conjuntos de datos de manera más rápida y ordenada.
10. Sesgo y valores extremos [cuándo la media representa bien y cuándo no] (PAES M1)
Sesgo y valores extremos [cuándo la media representa bien y cuándo no] (PAES M1)
Objetivo de la clase: analizar críticamente la media en distintos conjuntos de datos, reconociendo cuándo representa bien al grupo y cuándo se ve afectada por el sesgo o por valores extremos, en comparación con la mediana y la moda.
Hasta ahora has aprendido a calcular media, mediana y moda. En esta clase el foco cambia: ya no basta con calcular, sino que importa interpretar si una medida realmente describe bien al conjunto.
En particular, estudiaremos qué ocurre cuando los datos son equilibrados y qué pasa cuando aparece sesgo o un valor extremo. Verás que la media puede ser muy útil, pero no siempre representa bien la situación.
- Media: considera todos los datos del conjunto.
- Mediana: representa el valor central una vez ordenados los datos.
- Moda: indica el valor que más se repite.
- Valor extremo: dato muy alejado del resto.
- Sesgo: ocurre cuando la distribución se extiende más hacia un lado que hacia el otro.
La media es sensible a los valores extremos, porque usa todos los datos. La mediana suele resistir mejor esos cambios, porque depende de la posición central. La moda, en cambio, se relaciona con la frecuencia y puede mantenerse igual aunque cambien algunos valores aislados.
- hay uno o pocos valores muy grandes o muy pequeños,
- la mayoría de los datos está concentrada en una zona, pero la media queda lejos de ella,
- la distribución está claramente cargada hacia un lado.
Ejemplo 1: conjunto equilibrado
Considera los datos:
\[ 4,\ 5,\ 5,\ 6,\ 6,\ 7,\ 7 \]
Media:
\[ \bar{x}=\frac{4+5+5+6+6+7+7}{7}=\frac{40}{7}\approx 5{,}71 \]
Mediana: el dato central es \(6\).
Moda: hay dos modas: \(5\) y \(7\).
Interpretación: los datos están bastante equilibrados, por lo que la media y la mediana quedan cercanas. En un conjunto así, la media representa razonablemente bien al grupo.
Ejemplo 2: efecto de un valor extremo alto
Ahora observa:
\[ 4,\ 5,\ 5,\ 6,\ 6,\ 7,\ 20 \]
Media:
\[ \bar{x}=\frac{4+5+5+6+6+7+20}{7}=\frac{53}{7}\approx 7{,}57 \]
Mediana: el dato central sigue siendo \(6\).
Moda: las modas siguen siendo \(5\) y \(6\).
Interpretación: el valor 20 arrastra la media hacia arriba. La mayoría de los datos está entre 4 y 7, pero la media queda en \(7{,}57\), lejos del centro real del grupo. Aquí la mediana representa mejor al conjunto.
Ejemplo 3: efecto de un valor extremo bajo
Considera ahora:
\[ 1,\ 8,\ 8,\ 9,\ 9,\ 10,\ 10 \]
Media:
\[ \bar{x}=\frac{1+8+8+9+9+10+10}{7}=\frac{55}{7}\approx 7{,}86 \]
Mediana: el dato central es \(9\).
Moda: hay varias modas: \(8,\ 9,\ 10\).
Interpretación: el valor 1 baja la media. En cambio, la mediana sigue ubicada en el centro del grupo. Esto muestra otra vez que la media puede dejar de representar bien cuando aparece un valor extremo.
Ejemplo 4: sesgo hacia la derecha
Supongamos el siguiente conjunto:
\[ 2,\ 2,\ 3,\ 3,\ 3,\ 4,\ 10 \]
Media:
\[ \bar{x}=\frac{2+2+3+3+3+4+10}{7}=\frac{27}{7}\approx 3{,}86 \]
Mediana: \(3\).
Moda: \(3\).
Interpretación: la distribución tiene una cola hacia la derecha, porque aparece un valor alto que aleja la media del centro. En una situación así, la media queda mayor que la mediana.
Ejemplo 5: misma media, distinto comportamiento
Observa estos dos conjuntos:
| Conjunto A | Conjunto B |
|---|---|
| \(8,\ 8,\ 8,\ 8,\ 8\) | \(2,\ 5,\ 8,\ 11,\ 14\) |
En ambos casos:
\[ \bar{x}=8 \]
Pero el significado no es el mismo.
En el conjunto A todos los datos coinciden con la media. En el conjunto B la media es 8, pero los datos están mucho más dispersos.
Interpretación: tener la misma media no significa que dos grupos se comporten igual. Por eso, mirar solo el promedio puede ser insuficiente.
En temas como ingresos, precios o tiempos de espera, suele haber valores extremos. Por eso, decir solo “el promedio fue...” puede llevar a conclusiones engañosas. En muchos de esos contextos conviene acompañar la media con la mediana, o incluso preferir la mediana como descriptor principal.
- Que la media sea correcta no significa que sea la mejor descripción del grupo.
- Que la mediana sea más útil en un contexto no significa que la media esté mal calculada.
- Que la moda exista no significa que sea siempre la medida más informativa.
Ejercicios de práctica
- Calcula media, mediana y moda de \(3,\ 4,\ 4,\ 5,\ 5,\ 6,\ 7\). Luego indica si la media representa bien al grupo.
- Calcula media, mediana y moda de \(3,\ 4,\ 4,\ 5,\ 5,\ 6,\ 20\). Luego compara con el ejercicio anterior.
- Explica con tus palabras qué es un valor extremo.
- En el conjunto \(2,\ 2,\ 3,\ 3,\ 4,\ 4,\ 12\), ¿qué medida representa mejor el centro del grupo? Justifica.
- Construye un conjunto de 5 datos en el que la media y la mediana sean muy distintas.
- Construye un conjunto de 5 datos en el que la media represente bien al grupo.
- Compara los conjuntos \(5,\ 5,\ 5,\ 5,\ 5\) y \(1,\ 3,\ 5,\ 7,\ 9\). ¿Qué tienen en común y en qué se diferencian?
- Si en un grupo la mayoría de los datos está cerca de 10, pero hay un dato igual a 100, ¿qué medida central puede verse más afectada?
- En una tienda se registran las ventas diarias: \(20,\ 22,\ 21,\ 19,\ 20,\ 95\). Calcula media y mediana. Luego indica cuál conviene usar para describir un día típico.
- En un curso, las edades son \(14,\ 14,\ 15,\ 15,\ 15,\ 16,\ 30\). Calcula media, mediana y moda. Luego explica cuál describe mejor al grupo.
- Explica qué significa que una distribución esté sesgada hacia la derecha.
- Explica qué significa que dos grupos tengan la misma media, pero no necesariamente el mismo comportamiento.
- \[ \bar{x}=\frac{3+4+4+5+5+6+7}{7}=\frac{34}{7}\approx 4{,}86 \] \[ Me=5,\qquad Mo=4 \text{ y } 5 \] La media representa bastante bien al grupo, porque no hay valores extremos muy alejados.
- \[ \bar{x}=\frac{3+4+4+5+5+6+20}{7}=\frac{47}{7}\approx 6{,}71 \] \[ Me=5,\qquad Mo=4 \text{ y } 5 \] En comparación con el ejercicio anterior, la media sube mucho por efecto del 20, mientras la mediana cambia menos.
- Un valor extremo es un dato que está muy alejado del resto del conjunto y que puede alterar bastante algunas medidas, especialmente la media.
- La mediana representa mejor el centro, porque el 12 empuja la media hacia arriba.
- Una posible respuesta es: \(2,\ 3,\ 3,\ 4,\ 20\). Aquí la media queda mucho más alta que la mediana.
- Una posible respuesta es: \(8,\ 9,\ 10,\ 10,\ 11\). Aquí la media queda cerca del centro real del grupo.
- Ambos conjuntos tienen media 5, pero en el primero no hay variación y en el segundo los datos están más dispersos.
- La media es la medida que más puede verse afectada.
- \[ \bar{x}=\frac{20+22+21+19+20+95}{6}=\frac{197}{6}\approx 32{,}83 \] \[ Me=\frac{20+21}{2}=20{,}5 \] Conviene usar la mediana, porque el 95 distorsiona mucho la media.
- \[ \bar{x}=\frac{14+14+15+15+15+16+30}{7}=\frac{119}{7}=17 \] \[ Me=15,\qquad Mo=15 \] La mediana y la moda describen mejor al grupo, porque la edad 30 eleva demasiado la media.
- Significa que la distribución tiene una cola hacia los valores altos, por lo que suele aparecer algún dato grande que empuja la media hacia arriba.
- Significa que el promedio coincide, pero la forma en que se distribuyen los datos puede ser muy distinta.
Si la media queda lejos de la zona donde está la mayoría de los datos, probablemente no sea la mejor medida para describir al grupo.
Ejercicios tipo PAES
- Un conjunto de datos es \(4,\ 5,\ 5,\ 6,\ 6,\ 7,\ 25\). ¿Cuál afirmación es más adecuada?
- La media representa bien al grupo porque usa todos los datos.
- La mediana puede representar mejor el centro del grupo que la media.
- La moda siempre reemplaza a la mediana.
- La media y la mediana deben ser iguales.
- En un conjunto con fuerte presencia de valores extremos, la medida más sensible a esos cambios es:
- la moda
- la mediana
- la media
- ninguna de las tres
- Dos grupos tienen la misma media. A partir de eso se puede concluir que:
- los dos grupos tienen exactamente los mismos datos
- los dos grupos necesariamente tienen la misma mediana
- los dos grupos pueden ser diferentes aunque compartan la misma media
- los dos grupos tienen la misma moda
- En un curso, los puntajes son \(500,\ 510,\ 520,\ 530,\ 980\). Si se quiere describir el puntaje central del grupo sin dejarse influir demasiado por el valor 980, conviene usar:
- la moda
- la mediana
- la media
- la frecuencia acumulada
- Si una distribución está sesgada hacia la derecha, es esperable que:
- la media tienda a quedar mayor que la mediana
- la media tienda a quedar menor que la mediana
- la moda desaparezca siempre
- la mediana deje de existir
- ¿En cuál de los siguientes contextos la media suele ser un buen resumen?
- tallas de ropa más vendidas
- respuestas a una encuesta de transporte
- puntajes de un grupo equilibrado sin valores extremos notorios
- precios con un valor muy exagerado respecto del resto
- El valor 25 empuja la media hacia arriba, por lo que la mediana puede representar mejor el centro del grupo.
Respuesta correcta: B - La medida más sensible a valores extremos es la media.
Respuesta correcta: C - Compartir la misma media no obliga a que los grupos sean iguales en todo lo demás.
Respuesta correcta: C - Para describir el centro del grupo evitando la influencia del 980, conviene usar la mediana.
Respuesta correcta: B - En una distribución sesgada hacia la derecha, la media suele quedar mayor que la mediana.
Respuesta correcta: A - La media suele ser un buen resumen en grupos equilibrados y sin valores extremos notorios.
Respuesta correcta: C
La media no es “mala” cuando hay valores extremos: simplemente puede dejar de ser el mejor resumen del grupo. En PAES M1 es clave reconocer cuándo una medida central describe bien el contexto y cuándo conviene preferir otra.
11. Interpretación en contexto y decisión según situación [medidas centrales] (PAES M1)
Interpretación en contexto y decisión según situación [medidas centrales] (PAES M1)
Objetivo de la clase: resolver situaciones contextualizadas eligiendo y justificando la medida de tendencia central más adecuada, a partir de datos sueltos, tablas de frecuencias simples y tablas agrupadas.
En esta clase el foco no estará en aprender una fórmula nueva, sino en usar lo ya aprendido para tomar decisiones estadísticas con sentido. En muchos problemas no basta con calcular media, mediana o moda: también hay que decidir cuál de ellas responde mejor a la pregunta del contexto.
Por eso, aquí trabajaremos con situaciones donde lo importante será interpretar qué se quiere describir: un promedio global, un valor central resistente a extremos o el valor más frecuente.
- Media: conviene cuando se quiere resumir el comportamiento global de un conjunto cuantitativo y no hay valores extremos que distorsionen demasiado.
- Mediana: conviene cuando interesa el valor central del grupo y se quiere resistir mejor el efecto de valores muy altos o muy bajos.
- Moda: conviene cuando interesa saber qué valor o categoría aparece con mayor frecuencia.
- ¿El problema pide un promedio general?
- ¿El problema pide un valor típico o central sin dejarse arrastrar por extremos?
- ¿El problema pide identificar lo que más se repite?
- ¿Los datos son numéricos o son categorías?
Elegir bien una medida central depende del contexto. La media, la mediana y la moda no compiten entre sí: cada una destaca un aspecto distinto del conjunto. En una buena respuesta no basta con nombrar una medida; también hay que justificar por qué esa medida es la más adecuada.
- Usar la media en datos cualitativos, como tallas, colores o medios de transporte.
- Elegir la moda cuando el problema pide describir el centro del grupo.
- Elegir la media sin revisar si hay valores extremos.
- Responder solo con el nombre de la medida y no justificarla con el contexto.
Ejemplo 1: cuando conviene la media
Las notas de un estudiante en 5 evaluaciones son:
\[ 5{,}8,\ 6{,}0,\ 6{,}1,\ 6{,}2,\ 6{,}4 \]
Media:
\[ \bar{x}=\frac{5{,}8+6{,}0+6{,}1+6{,}2+6{,}4}{5}=\frac{30{,}5}{5}=6{,}1 \]
Mediana: \(6{,}1\)
Moda: no hay moda.
Decisión: aquí conviene la media, porque los datos son cuantitativos, equilibrados y no hay valores extremos que la distorsionen.
Ejemplo 2: cuando conviene la mediana
Los ingresos diarios, en miles de pesos, de 7 personas son:
\[ 18,\ 19,\ 20,\ 20,\ 21,\ 22,\ 60 \]
Media:
\[ \bar{x}=\frac{18+19+20+20+21+22+60}{7}=\frac{180}{7}\approx 25{,}71 \]
Mediana: \(20\)
Moda: \(20\)
Decisión: si se quiere describir el ingreso “típico” del grupo, conviene la mediana, porque el valor 60 eleva demasiado la media.
Ejemplo 3: cuando conviene la moda
Las tallas de zapatillas más vendidas en una tienda fueron:
\[ 37,\ 38,\ 38,\ 38,\ 39,\ 39,\ 40,\ 41 \]
Media:
\[ \bar{x}=\frac{37+38+38+38+39+39+40+41}{8}=\frac{310}{8}=38{,}75 \]
Mediana:
\[ Me=\frac{38+39}{2}=38{,}5 \]
Moda: \(38\)
Decisión: si la tienda quiere saber qué talla conviene reponer, la medida más útil es la moda, porque indica la talla más vendida.
Ejemplo 4: decisión en una tabla agrupada
La siguiente tabla resume tiempos de traslado, en minutos, de 20 estudiantes:
| Intervalo | \(f\) | \(F\) |
|---|---|---|
| \(0{-}9\) | 2 | 2 |
| \(10{-}19\) | 8 | 10 |
| \(20{-}29\) | 7 | 17 |
| \(30{-}39\) | 2 | 19 |
| \(80{-}89\) | 1 | 20 |
Aquí aparece un intervalo muy alto al final, lo que sugiere un valor extremo.
Decisión: si se quiere describir el tiempo “típico” de traslado, la mediana suele ser más conveniente que la media, porque resiste mejor la influencia del intervalo extremo \(80{-}89\).
La media se usa mucho para resumir notas, temperaturas o puntajes. La mediana es muy útil en ingresos, precios y tiempos cuando hay valores extremos. La moda es ideal para describir tallas, preferencias, respuestas frecuentes y categorías.
Ejercicios de práctica
- Con los datos \(1,\ 2,\ 2,\ 3,\ 3,\ 4,\ 4,\ 4,\ 5\), construye una tabla de frecuencias simple, calcula media, mediana y moda, y luego indica cuál medida representa mejor el “valor más habitual”.
- Los ingresos diarios, en miles de pesos, de un grupo son \(18,\ 19,\ 20,\ 20,\ 21,\ 22,\ 60\). Calcula media, mediana y moda. Luego justifica qué medida describe mejor el ingreso típico.
- Las tallas de polerón pedidas por un curso son \(S,\ M,\ M,\ L,\ M,\ S,\ M,\ L,\ XL\). ¿Qué medida central conviene usar aquí y por qué?
- Las notas de un estudiante son \(5{,}0,\ 5{,}5,\ 6{,}0,\ 6{,}0,\ 6{,}5,\ 7{,}0\). Calcula media, mediana y moda. Luego comenta qué sugiere el hecho de que las tres coincidan.
- Con los datos \(12,\ 13,\ 15,\ 16,\ 16,\ 17,\ 18,\ 18,\ 18,\ 19,\ 20,\ 21,\ 22,\ 22,\ 23,\ 24,\ 25,\ 26,\ 27,\ 28\), construye una tabla de frecuencias simple y calcula media, mediana y moda exactas. Luego agrupa en los intervalos \(10{-}14,\ 15{-}19,\ 20{-}24,\ 25{-}29\) y compara con las medidas agrupadas.
- La siguiente tabla resume tiempos de traslado, en minutos, de 20 estudiantes:
| Intervalo | \(f\) | \(F\) |
|---|---|---|
| \(0{-}9\) | 2 | 2 |
| \(10{-}19\) | 8 | 10 |
| \(20{-}29\) | 7 | 17 |
| \(30{-}39\) | 2 | 19 |
| \(80{-}89\) | 1 | 20 |
- Calcula media agrupada, mediana agrupada y moda agrupada. Luego justifica cuál medida representa mejor el tiempo “típico” de traslado.
- En una encuesta sobre medio de transporte al colegio se obtuvieron estas respuestas: bus, bus, bicicleta, caminar, bus, auto, caminar, bus. ¿Qué medida central tiene sentido usar aquí? Justifica.
- Los precios de unas entradas son \(5,\ 5,\ 5,\ 6,\ 6,\ 50\). Calcula media, mediana y moda. Luego indica qué medida conviene usar si se quiere describir el valor central sin que el precio 50 distorsione el resultado.
- Observa la siguiente tabla:
| Intervalo | \(f\) | \(F\) |
|---|---|---|
| \(0{-}9\) | 9 | 9 |
| \(10{-}19\) | 3 | 12 |
| \(20{-}29\) | 6 | 18 |
| \(30{-}39\) | 5 | 23 |
- Indica cuál es la clase modal y cuál es la clase mediana. Luego explica qué pregunta responde mejor la moda y qué pregunta responde mejor la mediana.
- Construye un ejemplo propio, con al menos 5 datos, en el que la mediana represente mejor el contexto que la media. Explica por qué.
- Tabla:
\[ \bar{x}=\frac{28}{9}\approx 3{,}11,\qquad Me=3,\qquad Mo=4 \] Si se pregunta por el valor más habitual, conviene usar la moda, porque identifica el valor más repetido.\(x_i\) \(f_i\) \(x_i\cdot f_i\) \(F\) 1 1 1 1 2 2 4 3 3 2 6 5 4 3 12 8 5 1 5 9 Total 9 28 9 - \[ \bar{x}=\frac{180}{7}\approx 25{,}71,\qquad Me=20,\qquad Mo=20 \] La mejor medida para describir el ingreso típico es la mediana, porque el valor 60 distorsiona mucho la media.
- Aquí conviene usar la moda, porque se trata de categorías y lo que interesa es saber cuál talla aparece más veces. La moda es \(M\).
- \[ \bar{x}=\frac{5{,}0+5{,}5+6{,}0+6{,}0+6{,}5+7{,}0}{6}=\frac{36}{6}=6{,}0 \] \[ Me=\frac{6{,}0+6{,}0}{2}=6{,}0,\qquad Mo=6{,}0 \] Que las tres coincidan sugiere que el conjunto está bastante equilibrado alrededor de 6,0.
- Medidas exactas:
Total: \[ n=20 \] Suma: \[ 400 \] Entonces: \[ \bar{x}=20 \] Mediana: \[ Me=\frac{19+20}{2}=19{,}5 \] Moda: \[ Mo=18 \] Tabla agrupada:
\[ \bar{x}\approx \frac{400}{20}=20 \] \[ Me\approx 14{,}5+\left(\frac{10-2}{8}\right)\cdot 5=19{,}5 \] \[ Mo\approx 14{,}5+\left(\frac{8-2}{(8-2)+(8-6)}\right)\cdot 5 \] \[ Mo\approx 14{,}5+\left(\frac{6}{8}\right)\cdot 5=18{,}25 \] La media y la mediana quedan muy cercanas a las exactas, mientras que la moda pasa de \(18\) a una estimación \(18{,}25\). Esto muestra que agrupar puede conservar bastante bien el centro, pero sigue implicando pérdida de precisión.Intervalo Marca de clase \(f\) \(f\cdot x_i\) \(F\) \(10{-}14\) 12 2 24 2 \(15{-}19\) 17 8 136 10 \(20{-}24\) 22 6 132 16 \(25{-}29\) 27 4 108 20 Total 20 400 20 - Media agrupada: Las marcas de clase son \(4{,}5,\ 14{,}5,\ 24{,}5,\ 34{,}5,\ 84{,}5\). \[ \sum f_i x_i = 2\cdot 4{,}5 + 8\cdot 14{,}5 + 7\cdot 24{,}5 + 2\cdot 34{,}5 + 1\cdot 84{,}5 \] \[ \sum f_i x_i = 9+116+171{,}5+69+84{,}5=450 \] \[ \bar{x}\approx \frac{450}{20}=22{,}5 \] Mediana agrupada:
\[ \frac{20}{2}=10 \] El intervalo mediano es \(10{-}19\). \[ Me\approx 9{,}5+\left(\frac{10-2}{8}\right)\cdot 10=19{,}5 \] Moda agrupada:
La clase modal es \(10{-}19\). \[ d_1=8-2=6,\qquad d_2=8-7=1 \] \[ Mo\approx 9{,}5+\left(\frac{6}{7}\right)\cdot 10\approx 18{,}07 \] La mejor medida para el tiempo típico es la mediana, porque hay un valor extremo en \(80{-}89\) que eleva bastante la media. - Aquí la medida adecuada es la moda, porque se trata de categorías. La respuesta más frecuente es bus.
- \[ \bar{x}=\frac{5+5+5+6+6+50}{6}=\frac{77}{6}\approx 12{,}83 \] \[ Me=\frac{5+6}{2}=5{,}5,\qquad Mo=5 \] Si se quiere describir el valor central sin que el 50 distorsione el resultado, conviene usar la mediana.
- La clase modal es \(0{-}9\), porque tiene frecuencia 9.
Como \(n=23\), \[ \frac{23}{2}=11{,}5 \] La frecuencia acumulada pasa de 9 a 12 en \(10{-}19\), así que la clase mediana es \(10{-}19\). La moda responde mejor la pregunta “¿dónde está la mayor concentración de datos?”.
La mediana responde mejor la pregunta “¿dónde está el centro de la distribución?”. - Una posible respuesta es: \[ 10,\ 11,\ 11,\ 12,\ 60 \] \[ \bar{x}=\frac{104}{5}=20{,}8,\qquad Me=11,\qquad Mo=11 \] La mediana representa mejor el contexto que la media, porque el valor 60 empuja mucho el promedio hacia arriba.
Antes de calcular, pregúntate qué se quiere describir: un promedio global, un valor central resistente o el valor más frecuente. Esa decisión suele ser más importante que la cuenta misma.
Ejercicios tipo PAES
- En un grupo, los tiempos de viaje al colegio son \(12,\ 13,\ 14,\ 15,\ 16,\ 18,\ 70\). Si se quiere describir el tiempo “típico” sin que un valor extremo distorsione el resultado, la medida más adecuada es:
- la moda
- la mediana
- la media
- ninguna de las tres
- Una tienda quiere saber qué talla de zapatilla debe reponer con mayor urgencia. La medida central más útil es:
- la media
- la mediana
- la media agrupada
- la moda
- ¿Cuál de las siguientes afirmaciones es correcta?
- En una tabla de frecuencias simple, las medidas siguen siendo exactas; en datos agrupados suelen ser aproximadas.
- En datos agrupados, la media siempre coincide exactamente con la media real.
- Agrupar datos no produce ninguna pérdida de información.
- La moda agrupada siempre coincide con una de las modas exactas.
- En una distribución de puntajes bastante equilibrada y sin valores extremos importantes, si se quiere resumir el rendimiento general del curso, conviene usar principalmente:
- la moda
- la mediana
- la media
- la amplitud
- En una encuesta sobre medio de transporte al colegio se obtienen respuestas como “bus”, “bicicleta”, “auto” y “caminar”. La medida central que tiene más sentido usar es:
- la media
- la moda
- la mediana
- la media agrupada
- Al agrupar un conjunto de datos que originalmente era bimodal en intervalos amplios, puede ocurrir que:
- la media desaparezca
- la mediana se vuelva exacta
- la frecuencia acumulada deje de tener sentido
- se oculte una parte de la información original sobre las modas
- La mediana es la más adecuada, porque el valor 70 es extremo y empuja la media hacia arriba.
Respuesta correcta: B - La tienda necesita saber cuál talla se repite más.
Respuesta correcta: D - La única afirmación correcta es que en la tabla simple las medidas siguen siendo exactas, mientras que en datos agrupados suelen ser aproximadas.
Respuesta correcta: A - Si la distribución es equilibrada y no tiene valores extremos importantes, la media resume bien el rendimiento global.
Respuesta correcta: C - Como se trata de categorías, la medida adecuada es la moda.
Respuesta correcta: B - Al agrupar datos, se puede perder detalle y ocultar que antes había más de una moda exacta.
Respuesta correcta: D
En PAES M1 no basta con calcular media, mediana o moda. También debes reconocer cuál conviene usar, qué información entrega y cómo justificar tu elección según la situación que se analiza.