1. Media aritmética en datos sueltos [cálculo, interpretación, limitaciones] (PAES M1)

Media aritmética en datos sueltos [cálculo, interpretación, limitaciones] (PAES M1)

Objetivo de la clase: calcular la media aritmética en conjuntos pequeños de datos, interpretarla en contexto y reconocer sus principales limitaciones, especialmente cuando existen valores extremos.

La media aritmética es una de las medidas de tendencia central más conocidas. Se usa para resumir un conjunto de datos mediante un solo valor, pero no siempre representa de la mejor manera lo que ocurre en el grupo. En esta página aprenderás a calcularla, a interpretarla y a decidir cuándo conviene usarla con cuidado.

📐 Definición de media aritmética

Si un conjunto de datos está formado por \(n\) valores \(x_1, x_2, x_3, \dots, x_n\), su media aritmética se calcula con la fórmula:

\[ \bar{x}=\dfrac{x_1+x_2+x_3+\cdots+x_n}{n} \]

Idea clave: se suman todos los datos y luego se divide por la cantidad total de datos.

💡 Estrategia para no equivocarte

Identifica todos los datos del conjunto.
Cuenta cuántos datos hay.
Suma sus valores.
Divide por la cantidad total de datos.
Interpreta el resultado en el contexto del problema.

🤓 ¿Qué significa realmente la media?

La media no tiene por qué ser uno de los datos del conjunto. Su función es resumir el comportamiento global del grupo. Por eso, en algunos contextos puede aparecer un valor decimal aunque los datos originales sean enteros.

Ejemplo 1: cálculo directo de la media

Las edades de 5 estudiantes que participan en un taller son:

\[ 14,\ 15,\ 13,\ 16,\ 17 \]

Paso 1: sumar los datos.

\[ 14+15+13+16+17=75 \]

Paso 2: dividir por la cantidad de datos.

Como hay 5 estudiantes:

\[ \bar{x}=\dfrac{75}{5}=15 \]

Interpretación: la edad promedio del grupo es 15 años.

Ejemplo 2: la media no siempre coincide con un dato

Las cantidades de goles anotados por un equipo en 4 partidos fueron:

\[ 1,\ 2,\ 2,\ 5 \]

Cálculo:

\[ \bar{x}=\dfrac{1+2+2+5}{4}=\dfrac{10}{4}=2{,}5 \]

Interpretación: el equipo anotó en promedio \(2{,}5\) goles por partido.

Aunque en ningún partido anotó exactamente \(2{,}5\) goles, la media sirve para resumir el rendimiento general.

Ejemplo 3: lectura de tabla y cálculo de media

La siguiente tabla muestra la cantidad de vasos de agua consumidos por una estudiante durante 5 días:

Día	Vasos de agua
Lunes	6
Martes	8
Miércoles	7
Jueves	5
Viernes	9

Cálculo de la media:

\[ \bar{x}=\dfrac{6+8+7+5+9}{5}=\dfrac{35}{5}=7 \]

Interpretación: en promedio, consumió 7 vasos de agua por día.

⚠️ Errores típicos al calcular la media

Dividir por la cantidad de valores distintos en lugar de dividir por la cantidad total de datos.
Olvidar incluir alguno de los datos en la suma.
Confundir media con mediana o con moda.
Dar una interpretación fuera de contexto, como si la media fuera siempre un valor real observado.

Ejemplo 4: limitación de la media ante un valor extremo

Supongamos que 5 estudiantes leyeron esta cantidad de libros en un mes:

\[ 2,\ 2,\ 3,\ 3,\ 15 \]

Cálculo de la media:

\[ \bar{x}=\dfrac{2+2+3+3+15}{5}=\dfrac{25}{5}=5 \]

Sin embargo, la mayoría de los estudiantes leyó entre 2 y 3 libros. El dato 15 es un valor extremo y empuja la media hacia arriba.

Conclusión: la media es útil, pero puede dejar de representar bien al grupo cuando aparece un valor muy alejado de los demás.

🌍 ¿Dónde aparece la media en la vida real?

La media se usa para resumir notas, temperaturas, tiempos, puntajes, ingresos, ventas y resultados de encuestas. Sin embargo, en algunos contextos —como salarios o precios— un valor extremo puede alterar bastante el promedio, por lo que no siempre basta con mirar solo la media para describir la situación.

🤓 Media e interpretación en PAES M1

En preguntas tipo PAES no solo pueden pedirte calcular la media. También pueden pedirte decidir si la media representa bien o no a un conjunto, comparar dos grupos con el mismo promedio o interpretar cómo cambia la media cuando se agrega o se quita un dato.

Ejercicios de práctica

Calcula la media aritmética de \(4,\ 6,\ 8,\ 10,\ 12\).
Calcula la media de \(3,\ 5,\ 7,\ 9\).
Las notas de un estudiante son \(5{,}0,\ 6{,}0,\ 4{,}5,\ 5{,}5\). Calcula la media.
La cantidad de mensajes recibidos por día en una semana fue \(8,\ 6,\ 7,\ 9,\ 5\). Calcula la media.
En una tabla aparecen las edades \(12,\ 13,\ 13,\ 14,\ 18\). Calcula la media e interpreta el resultado.
Un deportista recorrió \(3,\ 5,\ 4,\ 6,\ 7\) kilómetros en 5 días. ¿Cuál fue su distancia media diaria?
Un conjunto de datos es \(2,\ 2,\ 2,\ 2,\ 12\). Calcula la media y comenta si representa bien al grupo.
Construye un conjunto de 4 datos cuya media sea 10.
Si la media de 5 números es 8, ¿cuál es la suma total de esos 5 números?
La media de \(6,\ 8,\ x\) es 10. Determina el valor de \(x\).
Si a los datos \(4,\ 6,\ 8,\ 10\) se agrega el valor 12, ¿cuál es la nueva media?
Explica con tus palabras una limitación de la media aritmética.

💡 Pista para preguntas PAES

Cuando veas un promedio, no te quedes solo con el cálculo. Pregúntate también si ese valor realmente describe al grupo o si está siendo alterado por uno o dos datos muy alejados.

Ejercicios tipo PAES

La media aritmética de los datos \(6,\ 8,\ 10,\ 12\) es:
1. \(8\)
2. \(10{,}5\)
3. \(9\)
4. \(11\)
Un estudiante obtiene las notas \(4{,}0,\ 5{,}0,\ 6{,}0\) en tres pruebas. ¿Cuál es su media aritmética?
1. \(5{,}0\)
2. \(4{,}5\)
3. \(5{,}5\)
4. \(15\)
La cantidad de minutos que 5 personas tardan en llegar al colegio es \(10,\ 12,\ 11,\ 9,\ 38\). ¿Cuál afirmación es correcta?
1. La media representa muy bien al grupo porque usa todos los datos.
2. La media necesariamente coincide con uno de los tiempos observados.
3. La media no se puede calcular porque hay un valor muy alto.
4. La media puede verse afectada por el valor 38, por lo que podría no representar bien al grupo.
Si la media de 4 números es 7, entonces la suma de esos 4 números es:
1. \(11\)
2. \(28\)
3. \(7\)
4. \(21\)
La media de los datos \(3,\ 5,\ 7,\ x\) es 6. El valor de \(x\) es:
1. \(6\)
2. \(8\)
3. \(9\)
4. \(11\)
Se registran las ventas diarias de una tienda durante 5 días: \(20,\ 22,\ 21,\ 23,\ 24\). Si se agrega un sexto día con 40 ventas, ¿qué ocurre con la media?
1. Aumenta.
2. Disminuye.
3. Permanece igual.
4. No se puede determinar.

⚠️ Conclusión importante

La media aritmética es muy útil para resumir información, pero no debe interpretarse de manera automática. En PAES M1 puede aparecer como cálculo directo, como interpretación de contexto o como análisis crítico frente a valores extremos.

2. Mediana y moda en datos sueltos [comparación entre medidas centrales] (PAES M1)

Mediana y moda en datos sueltos [comparación entre medidas centrales] (PAES M1)

Objetivo de la clase: identificar, calcular y comparar la mediana y la moda en conjuntos pequeños de datos, interpretando cuál de estas medidas centrales resulta más útil según el contexto.

Cuando analizamos un conjunto de datos, no siempre basta con calcular un promedio. A veces interesa conocer el valor que queda al centro del grupo y, en otras ocasiones, el valor que aparece con mayor frecuencia. Para eso usamos la mediana y la moda.

En esta clase aprenderás a calcular ambas medidas en datos sueltos, a compararlas y a decidir cuál entrega información más útil en distintas situaciones, tal como puede ocurrir en preguntas de PAES M1.

📐 Definiciones clave

Mediana: es el valor central de un conjunto de datos una vez ordenado.
Si la cantidad de datos es impar, la mediana es el dato que queda justo al centro.
Si la cantidad de datos es par, la mediana es el promedio de los dos datos centrales.
Moda: es el dato que más se repite.
Un conjunto puede ser amodal (sin moda), unimodal (una moda) o bimodal o multimodal (dos o más modas).

💡 Estrategia para no confundirse

Primero ordena los datos. Después pregúntate: ¿quiero el valor que queda al centro o el que más se repite? Si buscas el centro, calcula la mediana. Si buscas frecuencia, identifica la moda.

🤓 Comparación importante

La mediana se fija en la posición de los datos ordenados, mientras que la moda se fija en la frecuencia de cada valor. Por eso, ambas medidas pueden ser distintas y describir aspectos diferentes de un mismo conjunto.

Ejemplo 1: mediana con cantidad impar de datos

Considera el conjunto:

\[ 7,\ 3,\ 5,\ 9,\ 4 \]

Paso 1: ordenar los datos.

\[ 3,\ 4,\ 5,\ 7,\ 9 \]

Paso 2: buscar el dato central.

Como hay 5 datos, la mediana es el tercer valor:

\[ \text{Mediana}=5 \]

Paso 3: revisar si hay moda.

Ningún valor se repite, por lo tanto no hay moda.

Ejemplo 2: mediana con cantidad par de datos

Considera el conjunto:

\[ 2,\ 8,\ 5,\ 6 \]

Paso 1: ordenar los datos.

\[ 2,\ 5,\ 6,\ 8 \]

Paso 2: identificar los dos valores centrales.

Como hay 4 datos, los dos centrales son \(5\) y \(6\).

Paso 3: calcular el promedio de esos dos valores.

\[ \text{Mediana}=\dfrac{5+6}{2}=5{,}5 \]

Moda: no hay moda, porque ningún dato se repite.

Ejemplo 3: identificación de la moda

Considera el conjunto:

\[ 4,\ 6,\ 4,\ 7,\ 4,\ 9,\ 6 \]

Paso 1: ordenar los datos.

\[ 4,\ 4,\ 4,\ 6,\ 6,\ 7,\ 9 \]

Paso 2: calcular la mediana.

Como hay 7 datos, la mediana es el cuarto valor:

\[ \text{Mediana}=6 \]

Paso 3: identificar la moda.

El valor que más se repite es \(4\), por lo tanto:

\[ \text{Moda}=4 \]

Conclusión: en este conjunto, la mediana y la moda son distintas.

Ejemplo 4: conjunto bimodal

Analicemos los datos:

\[ 2,\ 3,\ 3,\ 5,\ 5,\ 8 \]

Los datos ya están ordenados.

Mediana: como hay 6 datos, se promedian los dos centrales:

\[ \text{Mediana}=\dfrac{3+5}{2}=4 \]

Moda: los valores \(3\) y \(5\) aparecen dos veces cada uno.

Entonces, el conjunto tiene dos modas y es bimodal.

Ejemplo 5: lectura de tabla e interpretación

La siguiente tabla muestra la cantidad de horas de sueño de una estudiante durante 7 noches:

Noche	Horas de sueño
Lunes	7
Martes	8
Miércoles	7
Jueves	6
Viernes	7
Sábado	9
Domingo	8

Los datos son:

\[ 7,\ 8,\ 7,\ 6,\ 7,\ 9,\ 8 \]

Ordenamos:

\[ 6,\ 7,\ 7,\ 7,\ 8,\ 8,\ 9 \]

Mediana: el valor central es \(7\).

Moda: el valor que más se repite es \(7\).

Interpretación: tanto la mediana como la moda indican que dormir 7 horas fue un valor central y frecuente en la semana.

⚠️ Errores típicos

Buscar la mediana sin ordenar antes los datos.
Creer que la moda es siempre el dato mayor.
Pensar que todo conjunto tiene moda.
Olvidar que, si hay cantidad par de datos, la mediana se obtiene promediando los dos valores centrales.

🌍 Uso en la vida real

La moda se usa mucho cuando interesa conocer la opción más frecuente, por ejemplo la talla de calzado más vendida o la respuesta más común en una encuesta. La mediana, en cambio, es muy útil cuando se quiere describir un valor central sin dejarse arrastrar tanto por valores extremos, como puede ocurrir con tiempos, edades o ingresos.

🤓 Comparación entre medidas centrales

La mediana y la moda no compiten entre sí: cada una responde una pregunta distinta. La mediana responde cuál es el valor central del conjunto ordenado. La moda responde cuál es el valor más frecuente. En PAES M1 muchas veces lo importante no es solo calcular, sino decidir cuál de las dos medidas entrega una mejor descripción del contexto.

Ejercicios de práctica

Calcula la mediana de \(5,\ 2,\ 8,\ 1,\ 6\).
Calcula la mediana de \(4,\ 7,\ 9,\ 10\).
Determina la moda de \(3,\ 5,\ 3,\ 7,\ 8,\ 3\).
Determina la moda de \(2,\ 4,\ 6,\ 8,\ 10\).
Calcula la mediana y la moda de \(1,\ 2,\ 2,\ 4,\ 7,\ 7,\ 9\).
Calcula la mediana y la moda de \(6,\ 6,\ 8,\ 9,\ 10,\ 10\).
Ordena los datos \(12,\ 9,\ 11,\ 9,\ 15,\ 10\) y luego calcula mediana y moda.
Explica con tus palabras cuándo conviene observar la moda.
Explica con tus palabras cuándo conviene observar la mediana.
Construye un conjunto de 5 datos cuya mediana sea 8.
Construye un conjunto de 6 datos que tenga dos modas.
En el conjunto \(2,\ 2,\ 3,\ 4,\ 20\), calcula la mediana y la moda. Luego indica cuál de las dos describe mejor al grupo.

💡 Pista para preguntas PAES

Si una pregunta pide interpretar un conjunto con datos repetidos, piensa en la moda. Si pide analizar el valor central del grupo, especialmente con datos ordenados o con valores extremos, piensa en la mediana.

Ejercicios tipo PAES

La mediana del conjunto \(3,\ 5,\ 7,\ 9,\ 11\) es:
1. \(5\)
2. \(7\)
3. \(9\)
4. \(8\)
La moda del conjunto \(4,\ 6,\ 4,\ 8,\ 9,\ 4,\ 10\) es:
1. \(6\)
2. \(4\)
3. \(8\)
4. \(9\)
El conjunto \(2,\ 3,\ 5,\ 5,\ 8,\ 10\) tiene mediana igual a:
1. \(5\)
2. \(6{,}5\)
3. \(5{,}5\)
4. \(4\)
¿Cuál de los siguientes conjuntos es amodal?
1. \(1,\ 1,\ 2,\ 3,\ 4\)
2. \(2,\ 2,\ 3,\ 3,\ 5\)
3. \(4,\ 5,\ 6,\ 7,\ 8\)
4. \(6,\ 6,\ 6,\ 8,\ 9\)
En un grupo, las edades son \(12,\ 13,\ 13,\ 14,\ 20\). ¿Cuál afirmación es correcta?
1. La mediana es 13 y la moda es 13.
2. La mediana es 14 y la moda es 13.
3. La mediana es 13 y no hay moda.
4. La mediana es 14 y la moda es 20.
En el conjunto \(1,\ 2,\ 2,\ 3,\ 9\), ¿qué medida indica el valor más frecuente?
1. La media
2. La mediana
3. La moda
4. El rango

⚠️ Conclusión importante

En PAES M1 no basta con saber calcular. También debes reconocer qué medida responde mejor a la pregunta: la mediana para el valor central y la moda para el valor más frecuente. Leer con atención qué se pide es tan importante como hacer bien la cuenta.

3. Tablas de frecuencia simple

Tablas de frecuencia simple [frecuencia absoluta (f), relativa , acumulada (F), relativa acumulada (H), en decimal, fracción y porcentaje] (PAES M1)

Objetivo de la clase: organizar datos sueltos en una tabla de frecuencia simple, calcular frecuencia absoluta, relativa, acumulada y relativa acumulada, e interpretar estos valores en formato decimal, fracción y porcentaje.

Cuando un conjunto de datos comienza a crecer, deja de ser práctico mirar uno por uno todos los valores. En esos casos, conviene organizarlos en una tabla de frecuencia simple, porque permite ver con claridad cuántas veces aparece cada dato y qué proporción representa dentro del total.

En PAES M1 este contenido puede aparecer como cálculo directo, lectura de tabla, comparación entre frecuencias o interpretación de porcentajes acumulados.

📐 Elementos de una tabla de frecuencia simple

Frecuencia absoluta \(f\): cantidad de veces que aparece un dato.
Frecuencia relativa \(h\): proporción del total que representa un dato. \[ h=\dfrac{f}{n} \] donde \(n\) es la cantidad total de datos.
Frecuencia acumulada \(F\): suma progresiva de las frecuencias absolutas.
Frecuencia relativa acumulada \(H\): suma progresiva de las frecuencias relativas.

📐 Formas de expresar la frecuencia relativa

La frecuencia relativa puede escribirse de tres maneras equivalentes:

Como fracción: \(\dfrac{f}{n}\)
Como decimal: resultado de dividir \(\dfrac{f}{n}\)
Como porcentaje: \(h\cdot 100\%\)

Por ejemplo, si un dato aparece 3 veces en un total de 12 datos:

\[ h=\dfrac{3}{12}=\dfrac{1}{4}=0{,}25=25\% \]

💡 Estrategia para construir la tabla

Ordena o identifica los valores distintos del conjunto.
Cuenta cuántas veces aparece cada valor y completa \(f\).
Suma todas las frecuencias absolutas para verificar que den el total \(n\).
Calcula \(h=\dfrac{f}{n}\) para cada valor.
Acumula progresivamente las frecuencias para obtener \(F\) y \(H\).
Comprueba al final que la última frecuencia acumulada sea \(n\) y que la última frecuencia relativa acumulada sea \(1\) o \(100\%\).

⚠️ Errores típicos

Confundir frecuencia absoluta con frecuencia relativa.
Calcular \(h\) dividiendo por la cantidad de valores distintos en vez de dividir por el total de datos.
Olvidar que la última frecuencia acumulada debe ser igual al total de datos.
Olvidar que la última frecuencia relativa acumulada debe ser \(1\), o sea, \(100\%\).
Sumar mal los porcentajes por redondeo y pensar que la tabla está mala, cuando el problema es solo de aproximación decimal.

Ejemplo 1: construcción básica de una tabla de frecuencia

Se preguntó a 10 estudiantes cuántos hermanos tienen. Las respuestas fueron:

\[ 0,\ 1,\ 2,\ 1,\ 3,\ 2,\ 1,\ 0,\ 2,\ 1 \]

Primero identificamos los valores distintos: \(0,\ 1,\ 2,\ 3\).

Luego contamos cuántas veces aparece cada uno:

Número de hermanos	\(f\)	\(h\)	\(F\)	\(H\)
0	2	\(\dfrac{2}{10}=0{,}2=20\%\)	2	\(0{,}2=20\%\)
1	4	\(\dfrac{4}{10}=0{,}4=40\%\)	6	\(0{,}6=60\%\)
2	3	\(\dfrac{3}{10}=0{,}3=30\%\)	9	\(0{,}9=90\%\)
3	1	\(\dfrac{1}{10}=0{,}1=10\%\)	10	\(1=100\%\)

Interpretación: el valor más frecuente es 1 hermano, porque tiene frecuencia absoluta 4. Además, el 60% de los estudiantes tiene a lo más 1 hermano, porque la frecuencia relativa acumulada hasta 1 es 60%.

Ejemplo 2: frecuencia relativa como fracción, decimal y porcentaje

En un curso, las preferencias de colación fueron:

\[ \text{fruta, sándwich, fruta, yogurt, fruta, sándwich, yogurt, fruta} \]

Hay 8 respuestas en total.

Colación	\(f\)	Frecuencia relativa en fracción	Frecuencia relativa en decimal	Frecuencia relativa en porcentaje
Fruta	4	\(\dfrac{4}{8}=\dfrac{1}{2}\)	\(0{,}5\)	\(50\%\)
Sándwich	2	\(\dfrac{2}{8}=\dfrac{1}{4}\)	\(0{,}25\)	\(25\%\)
Yogurt	2	\(\dfrac{2}{8}=\dfrac{1}{4}\)	\(0{,}25\)	\(25\%\)

Interpretación: la mitad del curso prefirió fruta. Eso puede expresarse como \(\dfrac{1}{2}\), como \(0{,}5\) o como \(50\%\).

Ejemplo 3: frecuencia acumulada y relativa acumulada

Se registró la cantidad de mascotas en 12 hogares:

\[ 0,\ 1,\ 1,\ 2,\ 0,\ 3,\ 2,\ 1,\ 2,\ 4,\ 1,\ 0 \]

Contamos cada valor y completamos la tabla:

Mascotas	\(f\)	\(h\)	\(F\)	\(H\)
0	3	\(\dfrac{3}{12}=0{,}25=25\%\)	3	\(0{,}25=25\%\)
1	4	\(\dfrac{4}{12}=\dfrac{1}{3}\approx 0{,}333=33{,}3\%\)	7	\(\dfrac{7}{12}\approx 0{,}583=58{,}3\%\)
2	3	\(\dfrac{3}{12}=0{,}25=25\%\)	10	\(\dfrac{10}{12}\approx 0{,}833=83{,}3\%\)
3	1	\(\dfrac{1}{12}\approx 0{,}083=8{,}3\%\)	11	\(\dfrac{11}{12}\approx 0{,}917=91{,}7\%\)
4	1	\(\dfrac{1}{12}\approx 0{,}083=8{,}3\%\)	12	\(1=100\%\)

Interpretación: el 83,3% de los hogares tiene a lo más 2 mascotas, porque la frecuencia relativa acumulada hasta 2 es aproximadamente \(0{,}833\).

Ejemplo 4: lectura directa desde una tabla

Observa la siguiente tabla sobre cantidad de libros leídos por 15 estudiantes en un mes:

Libros leídos	\(f\)	\(h\)	\(F\)	\(H\)
0	3	\(0{,}2\)	3	\(0{,}2\)
1	5	\(\dfrac{1}{3}\approx 0{,}333\)	8	\(\dfrac{8}{15}\approx 0{,}533\)
2	4	\(\dfrac{4}{15}\approx 0{,}267\)	12	\(0{,}8\)
3	2	\(\dfrac{2}{15}\approx 0{,}133\)	14	\(\dfrac{14}{15}\approx 0{,}933\)
4	1	\(\dfrac{1}{15}\approx 0{,}067\)	15	\(1\)

De esta tabla se puede concluir que:

El dato más frecuente es 1 libro, porque tiene la mayor frecuencia absoluta.
El 20% no leyó libros.
El 80% leyó a lo más 2 libros.
Solo 1 estudiante leyó 4 libros.

🤓 ¿Qué significa “a lo más” en una tabla?

Cuando una pregunta dice “a lo más 2”, está incluyendo \(0\), \(1\) y \(2\). En una tabla de frecuencias, esa información se obtiene mirando la frecuencia acumulada o la frecuencia relativa acumulada hasta ese valor.

🌍 Uso en el mundo real

Las tablas de frecuencia se usan para resumir encuestas, resultados académicos, preferencias, tallas, tiempos de traslado, edades y muchos otros datos. Son muy útiles cuando se necesita comunicar información de forma ordenada y rápida, especialmente si se quiere comparar proporciones o acumulados.

Ejercicios de práctica

En los datos \(1,\ 2,\ 2,\ 3,\ 1,\ 2,\ 4,\ 1\), construye una tabla con valor y frecuencia absoluta.
Para los mismos datos del ejercicio anterior, calcula la frecuencia relativa de cada valor en forma decimal.
Expresa la frecuencia relativa del valor 2 del ejercicio 1 como fracción y como porcentaje.
En los datos \(0,\ 1,\ 1,\ 1,\ 2,\ 3,\ 3,\ 4\), calcula la frecuencia acumulada de cada valor.
En un grupo de 10 estudiantes, 3 prefieren té, 5 prefieren jugo y 2 prefieren leche. Calcula la frecuencia relativa de cada preferencia en decimal y porcentaje.
Construye una tabla de frecuencia simple para los datos \(5,\ 5,\ 6,\ 7,\ 5,\ 6,\ 8,\ 7,\ 6,\ 5\).
En una tabla, el valor 4 tiene frecuencia absoluta 6 y el total de datos es 24. Calcula su frecuencia relativa como fracción, decimal y porcentaje.
Si en una distribución la frecuencia acumulada hasta el valor 3 es 18, ¿qué significa eso en palabras?
Si la frecuencia relativa acumulada hasta cierto valor es \(0{,}75\), ¿qué porcentaje representa?
En un curso de 20 estudiantes, 4 obtuvieron nota 4, 8 obtuvieron nota 5, 6 obtuvieron nota 6 y 2 obtuvieron nota 7. Construye la tabla con \(f\), \(h\), \(F\) y \(H\).
En la tabla del ejercicio anterior, ¿qué porcentaje obtuvo a lo más nota 5?
En una encuesta de 12 personas, un resultado aparece 3 veces. ¿Cuál es su frecuencia relativa en fracción, decimal y porcentaje?

Los valores distintos son \(1,2,3,4\).
Sus frecuencias absolutas son:
- \(1 \rightarrow 3\)
- \(2 \rightarrow 3\)
- \(3 \rightarrow 1\)
- \(4 \rightarrow 1\)
Como hay 8 datos:
- Para \(1\): \(h=\dfrac{3}{8}=0{,}375\)
- Para \(2\): \(h=\dfrac{3}{8}=0{,}375\)
- Para \(3\): \(h=\dfrac{1}{8}=0{,}125\)
- Para \(4\): \(h=\dfrac{1}{8}=0{,}125\)
El valor 2 aparece 3 veces en 8 datos: \[ h=\dfrac{3}{8}=0{,}375=37{,}5\% \]
Frecuencias absolutas:
- \(0 \rightarrow 1\)
- \(1 \rightarrow 3\)
- \(2 \rightarrow 1\)
- \(3 \rightarrow 2\)
- \(4 \rightarrow 1\)
Frecuencias acumuladas:
- Hasta 0: \(1\)
- Hasta 1: \(4\)
- Hasta 2: \(5\)
- Hasta 3: \(7\)
- Hasta 4: \(8\)
Total \(=10\).
- Té: \(\dfrac{3}{10}=0{,}3=30\%\)
- Jugo: \(\dfrac{5}{10}=0{,}5=50\%\)
- Leche: \(\dfrac{2}{10}=0{,}2=20\%\)
Frecuencias absolutas:
- \(5 \rightarrow 4\)
- \(6 \rightarrow 3\)
- \(7 \rightarrow 2\)
- \(8 \rightarrow 1\)
Como hay 10 datos:
- \(h(5)=0{,}4\)
- \(h(6)=0{,}3\)
- \(h(7)=0{,}2\)
- \(h(8)=0{,}1\)
Frecuencias acumuladas:
- \(F: 4,7,9,10\)
- \(H: 0{,}4,\ 0{,}7,\ 0{,}9,\ 1\)
\[ h=\dfrac{6}{24}=\dfrac{1}{4}=0{,}25=25\% \]
Significa que hay 18 datos menores o iguales que 3, es decir, 18 observaciones con valor a lo más 3.
\[ 0{,}75=75\% \]

Total \(=20\).

Nota	\(f\)	\(h\)	\(F\)	\(H\)
4	4	\(\dfrac{4}{20}=0{,}2=20\%\)	4	\(0{,}2\)
5	8	\(\dfrac{8}{20}=0{,}4=40\%\)	12	\(0{,}6\)
6	6	\(\dfrac{6}{20}=0{,}3=30\%\)	18	\(0{,}9\)
7	2	\(\dfrac{2}{20}=0{,}1=10\%\)	20	\(1\)

A lo más nota 5 corresponde a la frecuencia relativa acumulada hasta 5: \[ 0{,}6=60\% \]
\[ h=\dfrac{3}{12}=\dfrac{1}{4}=0{,}25=25\% \]

💡 Pista para PAES

Si la pregunta habla de “qué parte del total”, probablemente debas mirar la frecuencia relativa. Si habla de “cuántos tienen a lo más”, probablemente debas mirar una frecuencia acumulada.

Ejercicios tipo PAES

En un grupo de 20 personas, 5 prefieren el color azul. La frecuencia relativa de quienes prefieren azul es:
1. \(0{,}4\)
2. \(\dfrac{1}{4}\)
3. \(30\%\)
4. \(5\%\)
Si un valor tiene frecuencia absoluta 6 en un total de 24 datos, su frecuencia relativa en porcentaje es:
1. \(20\%\)
2. \(30\%\)
3. \(25\%\)
4. \(40\%\)
En una tabla de frecuencias, la última frecuencia acumulada debe ser igual a:
1. la cantidad de valores distintos
2. la suma de las frecuencias relativas
3. el total de datos
4. el dato de mayor valor
En una distribución, la frecuencia relativa acumulada hasta cierto valor es \(0{,}8\). Esto significa que:
1. el 8% de los datos corresponde exactamente a ese valor
2. el 80% de los datos está en ese valor o por debajo de él
3. faltan 8 datos para completar el total
4. la frecuencia absoluta es 0,8
En una encuesta a 16 personas, una respuesta aparece 4 veces. ¿Cuál de las siguientes expresiones representa correctamente su frecuencia relativa?
1. \(\dfrac{4}{16}=\dfrac{1}{4}=0{,}25=25\%\)
2. \(\dfrac{4}{16}=0{,}4=40\%\)
3. \(\dfrac{4}{16}=\dfrac{1}{8}=0{,}125=12{,}5\%\)
4. \(\dfrac{4}{16}=4\%=0{,}04\)
La siguiente tabla resume el número de hijos en 10 familias:

Hijos \(f\)

0 2

1 3

2 4

3 1

¿Qué porcentaje de las familias tiene a lo más 1 hijo?
1. \(40\%\)
2. \(50\%\)
3. \(60\%\)
4. \(70\%\)

4. Media, moda y mediana en tablas simples de frecuencias (PAES M1)

Media, moda y mediana en tablas simples de frecuencias (PAES M1)

Objetivo de la clase: calcular e interpretar la media, la mediana y la moda a partir de tablas simples de frecuencias, comparando cuál medida central describe mejor un conjunto de datos según el contexto.

En la página anterior aprendiste a construir e interpretar tablas de frecuencia simple con frecuencia absoluta, relativa y acumulada. Ahora daremos un paso más: usar esa información para calcular las tres medidas de tendencia central más importantes, es decir, la media, la mediana y la moda.

La idea clave es que, aunque ya no veamos los datos uno por uno, la tabla conserva la información necesaria para resumir el conjunto y tomar decisiones, algo muy frecuente en preguntas tipo PAES M1.

📐 Recordatorio: ¿qué representa una tabla de frecuencias?

Si un valor \(x_i\) aparece \(f_i\) veces, entonces ese dato se repite esa cantidad de veces dentro del conjunto.

La suma de todas las frecuencias absolutas corresponde al total de datos:

\[ n=f_1+f_2+\cdots+f_k \]

📐 Fórmulas y criterios

Media: \[ \bar{x}=\dfrac{x_1f_1+x_2f_2+\cdots+x_kf_k}{n} \]
Moda: es el valor que tiene mayor frecuencia absoluta.
Mediana: corresponde al valor central del conjunto ordenado. En una tabla, se identifica usando la frecuencia acumulada.

💡 Estrategia para trabajar desde la tabla

Calcula el total de datos \(n\).
Para la media, multiplica cada valor por su frecuencia y suma esos productos.
Para la moda, busca la frecuencia absoluta más alta.
Para la mediana, ubica la posición central usando \(n\) y luego mira en qué valor cae esa posición según la frecuencia acumulada.

🤓 Idea importante

Trabajar con una tabla de frecuencias no cambia el significado de media, mediana y moda. Lo único que cambia es la forma de calcularlas. La tabla permite resumir muchos datos sin escribirlos todos.

Ejemplo 1: calcular la moda desde una tabla

La siguiente tabla muestra la cantidad de hermanos de 12 estudiantes:

Número de hermanos	Frecuencia \(f\)
0	2
1	5
2	3
3	2

La moda es el valor con mayor frecuencia.

La frecuencia más alta es \(5\), que corresponde al valor \(1\).

\[ \text{Moda}=1 \]

Interpretación: el número de hermanos más frecuente en este grupo es 1.

Ejemplo 2: calcular la media desde una tabla

Considera la tabla:

Puntaje	Frecuencia \(f\)	\(x\cdot f\)
2	3	6
3	4	12
4	2	8
5	1	5
Total	10	31

Como la suma de las frecuencias es \(10\), hay 10 datos en total.

La suma de los productos \(x\cdot f\) es \(31\).

Entonces:

\[ \bar{x}=\dfrac{31}{10}=3{,}1 \]

Interpretación: el puntaje promedio es \(3{,}1\).

Ejemplo 3: calcular la mediana con frecuencia acumulada

La tabla muestra la cantidad de mascotas en 9 hogares:

Mascotas	\(f\)	\(F\)
0	2	2
1	3	5
2	2	7
3	2	9

Como hay \(n=9\) datos, la mediana corresponde a la posición:

\[ \dfrac{9+1}{2}=5 \]

Ahora observamos en qué valor cae la posición 5.

Según la frecuencia acumulada:

hasta 0 mascotas llegamos a la posición 2,
hasta 1 mascota llegamos a la posición 5.

Entonces la posición 5 corresponde al valor 1.

\[ \text{Mediana}=1 \]

Ejemplo 4: mediana con cantidad par de datos

La siguiente tabla resume las notas de 8 estudiantes:

Nota	\(f\)	\(F\)
4	2	2
5	3	5
6	2	7
7	1	8

Como hay \(n=8\) datos, la mediana se obtiene promediando las posiciones 4 y 5.

Según la frecuencia acumulada, tanto la posición 4 como la posición 5 caen en la nota 5.

Entonces:

\[ \text{Mediana}=\dfrac{5+5}{2}=5 \]

Ejemplo 5: comparación entre media, mediana y moda

Observa la tabla:

Valor	\(f\)	\(x\cdot f\)	\(F\)
2	4	8	4
3	3	9	7
4	1	4	8
10	1	10	9
Total	9	31	9

Moda: la frecuencia más alta es 4, por lo tanto la moda es 2.

Mediana: como \(n=9\), la mediana es la posición 5. Según la frecuencia acumulada, la posición 5 cae en el valor 3.

\[ \text{Mediana}=3 \]

Media:

\[ \bar{x}=\dfrac{31}{9}\approx 3{,}44 \]

Conclusión: en esta tabla, media, mediana y moda son distintas. Cada una describe un aspecto diferente del conjunto.

⚠️ Errores típicos

Calcular la media sumando solo los valores y olvidando multiplicar por sus frecuencias.
Confundir la moda con el valor mayor de la tabla.
Buscar la mediana sin considerar la frecuencia acumulada.
En cantidad par de datos, olvidar promediar las dos posiciones centrales.

🌍 ¿Por qué importa comparar las tres medidas?

En contextos reales, como resultados de pruebas, tiempos de viaje o número de hijos por familia, las tres medidas pueden contar historias distintas. La moda muestra lo más frecuente, la mediana muestra el centro del conjunto y la media resume globalmente todos los datos. En PAES M1 es común que te pidan decidir cuál describe mejor la situación.

Ejercicios de práctica

En la tabla \(x: 1,2,3\) con frecuencias \(f: 2,5,1\), determina la moda.
En la tabla \(x: 2,4,6\) con frecuencias \(f: 3,2,1\), calcula la media.
En la tabla \(x: 1,2,3,4\) con frecuencias \(f: 1,2,3,2\), calcula la moda.
En la tabla \(x: 3,4,5\) con frecuencias \(f: 2,4,2\), determina la mediana.
Construye la columna \(x\cdot f\) para la tabla \(x: 2,3,5\) con frecuencias \(f: 4,1,2\).
En la tabla \(x: 0,1,2,3\) con frecuencias \(f: 1,3,4,2\), calcula la media.
En la tabla \(x: 4,5,6,7\) con frecuencias \(f: 2,3,2,1\), calcula la mediana.
En la tabla \(x: 1,2,6\) con frecuencias \(f: 4,3,1\), calcula media, mediana y moda.
Explica con tus palabras cómo se obtiene la moda en una tabla de frecuencias.
Explica con tus palabras cómo se obtiene la mediana en una tabla de frecuencias.
En la tabla \(x: 2,3,4,10\) con frecuencias \(f: 3,3,2,1\), calcula media, mediana y moda.
¿Cuál medida central representa mejor el conjunto del ejercicio anterior? Justifica brevemente.

💡 Pista para PAES

Cuando una tabla incluye valores extremos, conviene comparar la media con la mediana. Si la media se aleja bastante del centro de los datos, la mediana suele representar mejor al grupo.

Ejercicios tipo PAES

La siguiente tabla muestra los resultados de una encuesta:

Valor \(f\)

1 2

2 5

3 1

¿Cuál es la moda?
1. \(2\)
2. \(1\)
3. \(3\)
4. \(8\)
En una tabla de frecuencias, los valores son \(2,\ 4,\ 6\) y sus frecuencias son \(1,\ 2,\ 1\). La media es:
1. \(4\)
2. \(3\)
3. \(4{,}5\)
4. \(5\)
La tabla siguiente resume 7 datos:

Valor \(f\)

2 3

4 2

5 2

¿Cuál es la mediana?
1. \(5\)
2. \(3\)
3. \(2\)
4. \(4\)
En la tabla \(x: 1,2,3,4\) con frecuencias \(f: 2,4,1,1\), ¿cuál afirmación es correcta?
1. La moda es 4.
2. La media es 2.
3. La mediana es 3.
4. No existe moda.
En la tabla \(x: 2,3,8\) con frecuencias \(f: 4,3,1\), la comparación correcta entre medidas es:
1. Media = mediana = moda
2. Moda \(=2\), mediana \(=2{,}5\), media \(=3{,}125\)
3. Moda \(=3\), mediana \(=3\), media \(=2\)
4. Moda \(=2\), mediana \(=2\), media \(=3{,}125\)
En una tabla de frecuencias, un valor extremo alto hace que:
1. la moda siempre cambie
2. la mediana deje de existir
3. la media pueda aumentar más que la mediana
4. las tres medidas sean siempre iguales

Valor	\(f\)
1	2
2	5
3	1

Valor	\(f\)
2	3
4	2
5	2

⚠️ Revisión importante

En preguntas tipo PAES, no basta con hacer cuentas. También debes revisar si las alternativas son coherentes con los cálculos. La moda depende de la frecuencia más alta, la mediana depende de la posición central y la media depende de todos los datos.

5. tablas de datos agrupados por intervalos

Confección de tablas de datos agrupados por intervalos [marca de clase, \(f\), \(F\), \(h\), \(H\), intervalos aparentes e intervalos reales] (PAES M1)

Objetivo de la clase: organizar datos cuantitativos en tablas agrupadas por intervalos, calcular marca de clase, frecuencia absoluta, frecuencia acumulada, frecuencia relativa y frecuencia relativa acumulada, distinguiendo además entre intervalos aparentes e intervalos reales.

Cuando la cantidad de datos es grande o los valores son muy variados, deja de ser práctico trabajar con cada dato por separado. En esos casos conviene agrupar los datos en intervalos, porque así se puede resumir la información y observar mejor cómo se distribuye.

En esta clase aprenderás a confeccionar una tabla de datos agrupados por intervalos, identificar sus elementos principales y distinguir entre intervalos aparentes e intervalos reales, algo muy importante cuando los datos provienen de mediciones.

📐 Elementos de una tabla agrupada

Intervalos de clase: grupos de valores, por ejemplo \(10{-}14\), \(15{-}19\), \(20{-}24\).
Frecuencia absoluta \(f\): cantidad de datos que caen en cada intervalo.
Frecuencia acumulada \(F\): suma progresiva de las frecuencias absolutas.
Frecuencia relativa \(h\): proporción que representa cada intervalo respecto del total. \[ h=\dfrac{f}{n} \]
Frecuencia relativa acumulada \(H\): suma progresiva de las frecuencias relativas.
Marca de clase \(x_i\): punto medio del intervalo. \[ x_i=\dfrac{\text{límite inferior}+\text{límite superior}}{2} \]

📐 Intervalos aparentes e intervalos reales

Intervalo aparente: es el que se escribe directamente en la tabla, por ejemplo \(10{-}14\).

Intervalo real: es el que realmente cubre los valores cuando la variable fue registrada con una unidad determinada.

Por ejemplo, si los datos fueron anotados en números enteros, el intervalo aparente \(10{-}14\) tiene como intervalo real:

\[ 9{,}5 \le x < 14{,}5 \]

y el intervalo aparente \(15{-}19\) tiene como intervalo real:

\[ 14{,}5 \le x < 19{,}5 \]

🤓 Relación entre intervalos aparentes, intervalos reales y marca de clase

Aunque los intervalos aparentes y los intervalos reales se escriben de manera distinta, ambos entregan la misma marca de clase, porque tienen el mismo punto medio.

Por ejemplo, para el intervalo aparente \(10{-}14\), su intervalo real es \(9{,}5 \le x < 14{,}5\).

Si calculamos la marca de clase con los extremos aparentes, obtenemos:

\[ \dfrac{10+14}{2}=12 \]

Y si la calculamos con los extremos reales, obtenemos:

\[ \dfrac{9{,}5+14{,}5}{2}=12 \]

Por lo tanto, la marca de clase es la misma en ambos casos.

Sin embargo, los intervalos reales serán muy útiles más adelante, especialmente cuando trabajemos con mayor precisión la media y la mediana en datos agrupados.

💡 Cómo confeccionar una tabla agrupada

Revisa el conjunto de datos y observa desde qué valor mínimo hasta qué valor máximo se extiende.
Elige intervalos que cubran todo el rango de datos, sin superponerse.
Cuenta cuántos datos caen en cada intervalo y completa \(f\).
Calcula la marca de clase de cada intervalo.
Obtén \(F\), \(h\) y \(H\).
Verifica al final que la última frecuencia acumulada sea \(n\) y que la última frecuencia relativa acumulada sea \(1\) o \(100\%\).

Ejemplo 1: construcción de una tabla agrupada

Se registraron las edades de 20 personas:

\[ 12,\ 13,\ 15,\ 16,\ 17,\ 18,\ 19,\ 19,\ 20,\ 21,\ 22,\ 23,\ 24,\ 24,\ 25,\ 26,\ 27,\ 28,\ 29,\ 30 \]

Elegimos intervalos aparentes de amplitud 5:

\[ 10{-}14,\quad 15{-}19,\quad 20{-}24,\quad 25{-}29,\quad 30{-}34 \]

Luego escribimos sus intervalos reales, calculamos la marca de clase y contamos cuántos datos hay en cada intervalo.

Intervalo aparente	Intervalo real	Marca de clase \(x_i\)	\(f\)	\(F\)	\(h\)	\(H\)
\(10{-}14\)	\(9{,}5 \le x < 14{,}5\)	12	2	2	\(\dfrac{2}{20}=0{,}1=10\%\)	\(0{,}1=10\%\)
\(15{-}19\)	\(14{,}5 \le x < 19{,}5\)	17	6	8	\(\dfrac{6}{20}=0{,}3=30\%\)	\(0{,}4=40\%\)
\(20{-}24\)	\(19{,}5 \le x < 24{,}5\)	22	6	14	\(\dfrac{6}{20}=0{,}3=30\%\)	\(0{,}7=70\%\)
\(25{-}29\)	\(24{,}5 \le x < 29{,}5\)	27	5	19	\(\dfrac{5}{20}=0{,}25=25\%\)	\(0{,}95=95\%\)
\(30{-}34\)	\(29{,}5 \le x < 34{,}5\)	32	1	20	\(\dfrac{1}{20}=0{,}05=5\%\)	\(1=100\%\)

Interpretación: el 30% de los datos está entre 15 y 19 años, y el 70% está a lo más en el intervalo \(20{-}24\).

Ejemplo 2: misma marca de clase usando intervalos aparentes o reales

Consideremos el intervalo aparente \(20{-}24\). Su intervalo real es:

\[ 19{,}5 \le x < 24{,}5 \]

Si usamos el intervalo aparente, la marca de clase es:

\[ \dfrac{20+24}{2}=22 \]

Si usamos el intervalo real, la marca de clase es:

\[ \dfrac{19{,}5+24{,}5}{2}=22 \]

Conclusión: ambos intervalos entregan la misma marca de clase.

Por eso, al confeccionar la tabla, la marca de clase puede calcularse directamente desde el intervalo aparente. Sin embargo, los intervalos reales son útiles para interpretar con mayor precisión qué valores pertenecen realmente a cada clase.

Ejemplo 3: cálculo de marcas de clase

Considera los siguientes intervalos aparentes:

\[ 5{-}9,\quad 10{-}14,\quad 15{-}19,\quad 20{-}24 \]

Sus marcas de clase son:

\[ \dfrac{5+9}{2}=7 \]
\[ \dfrac{10+14}{2}=12 \]
\[ \dfrac{15+19}{2}=17 \]
\[ \dfrac{20+24}{2}=22 \]

Interpretación: la marca de clase representa el valor central de cada intervalo y se usará más adelante para estimar la media en datos agrupados.

Ejemplo 4: lectura de una tabla agrupada

Observa la siguiente tabla sobre tiempos de traslado de 25 estudiantes:

Intervalo aparente	Intervalo real	Marca de clase	\(f\)	\(F\)	\(h\)	\(H\)
\(0{-}9\)	\(-0{,}5 \le x < 9{,}5\)	\(4{,}5\)	4	4	\(\dfrac{4}{25}=0{,}16=16\%\)	\(0{,}16=16\%\)
\(10{-}19\)	\(9{,}5 \le x < 19{,}5\)	\(14{,}5\)	8	12	\(\dfrac{8}{25}=0{,}32=32\%\)	\(0{,}48=48\%\)
\(20{-}29\)	\(19{,}5 \le x < 29{,}5\)	\(24{,}5\)	7	19	\(\dfrac{7}{25}=0{,}28=28\%\)	\(0{,}76=76\%\)
\(30{-}39\)	\(29{,}5 \le x < 39{,}5\)	\(34{,}5\)	4	23	\(\dfrac{4}{25}=0{,}16=16\%\)	\(0{,}92=92\%\)
\(40{-}49\)	\(39{,}5 \le x < 49{,}5\)	\(44{,}5\)	2	25	\(\dfrac{2}{25}=0{,}08=8\%\)	\(1=100\%\)

De esta tabla se puede concluir que:

El intervalo más frecuente es \(10{-}19\) minutos.
El 48% tarda a lo más 19 minutos.
El 76% tarda a lo más 29 minutos.
La marca de clase del intervalo \(30{-}39\) es \(34{,}5\).

⚠️ Errores típicos

Construir intervalos que se traslapan, por ejemplo \(10{-}15\) y \(15{-}20\), sin aclarar el criterio.
Confundir marca de clase con amplitud del intervalo.
Olvidar que la última frecuencia acumulada debe coincidir con el total de datos.
Calcular mal la frecuencia relativa al no dividir por el total.
Creer que intervalo aparente e intervalo real entregan distinta marca de clase.

🌍 ¿Dónde se usan estas tablas?

Las tablas agrupadas por intervalos se usan para resumir edades, estaturas, pesos, tiempos, puntajes y otras variables cuantitativas. Son muy útiles cuando hay muchos datos y se necesita observar tendencias generales en vez de revisar cada valor por separado.

Ejercicios de práctica

Calcula la marca de clase de los intervalos \(10{-}14\), \(15{-}19\) y \(20{-}24\).
Escribe los intervalos reales correspondientes a los intervalos aparentes \(30{-}34\) y \(35{-}39\).
En una tabla agrupada, un intervalo tiene frecuencia absoluta 6 y el total de datos es 24. Calcula su frecuencia relativa en fracción, decimal y porcentaje.
Si las frecuencias absolutas de tres intervalos son \(4,\ 7,\ 9\), calcula las frecuencias acumuladas.
Si las frecuencias relativas de cuatro intervalos son \(0{,}2,\ 0{,}35,\ 0{,}25,\ 0{,}2\), calcula las frecuencias relativas acumuladas.
Completa la siguiente idea: la marca de clase del intervalo \(12{-}18\) es \( \underline{\hspace{1.5cm}} \).
Construye una tabla con intervalos \(0{-}4\), \(5{-}9\), \(10{-}14\) si las frecuencias son \(3,\ 5,\ 2\). Agrega \(F\).
En una tabla agrupada, la última frecuencia acumulada es 40. ¿Qué significa eso?
En una distribución, la frecuencia relativa acumulada hasta el tercer intervalo es \(0{,}85\). ¿Qué porcentaje representa?
Explica con tus palabras la diferencia entre intervalo aparente e intervalo real.
Si el intervalo aparente es \(50{-}59\), ¿cuál es su marca de clase?
Si una tabla tiene intervalos \(100{-}109\), \(110{-}119\), \(120{-}129\), escribe los intervalos reales correspondientes.

\[ \dfrac{10+14}{2}=12,\qquad \dfrac{15+19}{2}=17,\qquad \dfrac{20+24}{2}=22 \]
\[ 29{,}5 \le x < 34{,}5 \] y \[ 34{,}5 \le x < 39{,}5 \]
\[ h=\dfrac{6}{24}=\dfrac{1}{4}=0{,}25=25\% \]
Las frecuencias acumuladas son: \[ 4,\quad 11,\quad 20 \]
Las frecuencias relativas acumuladas son: \[ 0{,}2,\quad 0{,}55,\quad 0{,}8,\quad 1 \]
\[ \dfrac{12+18}{2}=15 \]
Intervalo \(f\) \(F\)

\(0{-}4\) 3 3

\(5{-}9\) 5 8

\(10{-}14\) 2 10
Significa que el total de datos de la distribución es 40.
\[ 0{,}85=85\% \]
El intervalo aparente es el que se escribe en la tabla, por ejemplo \(10{-}14\). El intervalo real ajusta los límites para representar correctamente mediciones continuas, por ejemplo \(9{,}5 \le x < 14{,}5\).
\[ \dfrac{50+59}{2}=54{,}5 \]
\[ 99{,}5 \le x < 109{,}5,\qquad 109{,}5 \le x < 119{,}5,\qquad 119{,}5 \le x < 129{,}5 \]

Intervalo	\(f\)	\(F\)
\(0{-}4\)	3	3
\(5{-}9\)	5	8
\(10{-}14\)	2	10

💡 Pista para preguntas PAES

Cuando aparezca una tabla agrupada, revisa primero si te piden leer frecuencias, interpretar acumulados, calcular marcas de clase o distinguir entre intervalo aparente e intervalo real. Muchas veces el error no está en la cuenta, sino en no identificar qué representa cada columna.

Ejercicios tipo PAES

La marca de clase del intervalo \(20{-}29\) es:
1. \(24{,}5\)
2. \(25\)
3. \(9\)
4. \(49\)
Si un intervalo tiene frecuencia absoluta 8 y el total de datos es 40, su frecuencia relativa en porcentaje es:
1. \(8\%\)
2. \(25\%\)
3. \(40\%\)
4. \(20\%\)
La última frecuencia acumulada de una tabla agrupada representa:
1. la amplitud del último intervalo
2. el total de datos
3. la suma de las marcas de clase
4. la frecuencia relativa mayor
El intervalo real correspondiente al intervalo aparente \(15{-}19\), si los datos fueron registrados en enteros, es:
1. \(15 \le x \le 19\)
2. \(14{,}5 \le x < 19{,}5\)
3. \(15{,}5 \le x < 19{,}5\)
4. \(14 \le x < 20\)
Si las frecuencias absolutas de tres intervalos son \(5,\ 7,\ 3\), entonces la frecuencia acumulada del segundo intervalo es:
1. \(15\)
2. \(10\)
3. \(12\)
4. \(7\)
En una tabla agrupada, la frecuencia relativa acumulada hasta el cuarto intervalo es \(0{,}9\). Esto significa que:
1. el 90% de los datos está exactamente en el cuarto intervalo
2. el 9% de los datos está bajo el cuarto intervalo
3. faltan 0,1 datos para completar el total
4. el 90% de los datos está en ese intervalo o en los anteriores

⚠️ Conclusión importante

En tablas agrupadas por intervalos, cada columna tiene un significado distinto. Para responder bien en PAES M1, debes distinguir entre contar datos, acumular frecuencias, expresar proporciones, calcular marcas de clase y reconocer que los intervalos aparentes y reales comparten el mismo punto medio, aunque describen la clase con distinto nivel de precisión.

6. Media en datos agrupados

Media en datos agrupados [marca de clase, aproximación] (PAES M1)

Objetivo de la clase: calcular e interpretar la media en datos agrupados usando la marca de clase, comprendiendo que el resultado obtenido es una aproximación del promedio real.

Cuando los datos están agrupados por intervalos, ya no conocemos cada valor exacto del conjunto. En ese caso, la media no se puede calcular de manera exacta como en los datos sueltos, sino que se estima usando la marca de clase de cada intervalo.

Por eso, en esta unidad la media en datos agrupados debe entenderse como una aproximación. Aun así, sigue siendo muy útil para resumir la distribución y comparar grupos, algo que aparece con frecuencia en ejercicios tipo PAES M1.

📐 Fórmula de la media en datos agrupados

Si una tabla tiene marcas de clase \(x_i\) y frecuencias absolutas \(f_i\), la media agrupada se calcula con:

\[ \bar{x}\approx \dfrac{x_1f_1+x_2f_2+\cdots+x_kf_k}{n} \]

donde \(n=f_1+f_2+\cdots+f_k\) es el total de datos.

🤓 ¿Por qué aparece el símbolo \(\approx\)?

Aparece porque no estamos usando los datos reales uno por uno, sino la marca de clase como representante de todos los valores de cada intervalo. Eso permite estimar la media, pero no garantiza que coincida exactamente con el promedio real del conjunto.

💡 Estrategia de cálculo

Identifica la marca de clase de cada intervalo.
Multiplica cada marca de clase por su frecuencia.
Suma todos los productos \(x_i\cdot f_i\).
Suma las frecuencias para obtener el total \(n\).
Divide: \[ \bar{x}\approx\dfrac{\sum x_if_i}{n} \]

⚠️ Error conceptual frecuente

La media en datos agrupados no suele ser exacta. Se trata de una estimación. El error más común es olvidar esto y hablar del resultado como si fuera el promedio exacto de todos los datos originales.

Ejemplo 1: cálculo básico de la media agrupada

La siguiente tabla resume las edades de 20 personas:

Intervalo	Marca de clase \(x_i\)	\(f_i\)	\(x_i\cdot f_i\)
\(10{-}14\)	12	2	24
\(15{-}19\)	17	6	102
\(20{-}24\)	22	6	132
\(25{-}29\)	27	5	135
\(30{-}34\)	32	1	32
Total	-	20	425

Aplicamos la fórmula:

\[ \bar{x}\approx\dfrac{425}{20}=21{,}25 \]

Interpretación: la edad media del grupo es aproximadamente \(21{,}25\) años.

Ejemplo 2: por qué es una aproximación

Supongamos que en el intervalo \(20{-}24\) hay 6 personas. En la media agrupada, a esas 6 personas se les representa usando la marca de clase \(22\).

Eso equivale a tratar el grupo como si sus 6 edades fueran aproximadamente 22. Pero en realidad podrían ser, por ejemplo, \(20,\ 21,\ 22,\ 23,\ 24,\ 24\), o alguna otra combinación.

Por eso, la media agrupada:

usa información resumida,
pierde detalle respecto de los datos originales,
y entrega una estimación razonable del promedio.

Ejemplo 3: lectura de una tabla y cálculo completo

La siguiente tabla muestra los tiempos de traslado, en minutos, de 25 estudiantes:

Intervalo	Marca de clase \(x_i\)	\(f_i\)	\(x_i\cdot f_i\)
\(0{-}9\)	\(4{,}5\)	4	18
\(10{-}19\)	\(14{,}5\)	8	116
\(20{-}29\)	\(24{,}5\)	7	171{,}5
\(30{-}39\)	\(34{,}5\)	4	138
\(40{-}49\)	\(44{,}5\)	2	89
Total	-	25	532{,}5

Entonces:

\[ \bar{x}\approx\dfrac{532{,}5}{25}=21{,}3 \]

Interpretación: el tiempo promedio de traslado es aproximadamente \(21{,}3\) minutos.

Ejemplo 4: comparación con datos no agrupados

En datos sueltos, la media se calcula con los valores exactos del conjunto. En cambio, en datos agrupados se usan marcas de clase.

Eso significa que la media agrupada es más rápida de calcular cuando hay muchos datos, pero menos precisa que la media exacta.

Situación	Tipo de media
Se conocen todos los datos exactos	Media exacta
Los datos están resumidos en intervalos	Media aproximada

🌍 Uso en el mundo real

La media agrupada se usa cuando hay grandes cantidades de datos resumidos en rangos, por ejemplo edades de una población, tiempos de espera, ingresos, estaturas o puntajes. En esos contextos, la tabla permite obtener una estimación útil sin revisar uno por uno todos los valores originales.

🤓 Relación con lo aprendido antes

En la clase anterior viste que la marca de clase representa el punto medio de cada intervalo. Aquí esa idea se vuelve fundamental, porque cada marca de clase actúa como representante de todo el intervalo al calcular la media agrupada.

Ejercicios de práctica

Calcula la media aproximada de la tabla con intervalos \(0{-}4,\ 5{-}9,\ 10{-}14\) y frecuencias \(2,\ 5,\ 3\).
Construye la columna \(x_i\cdot f_i\) para una tabla con marcas de clase \(3,\ 8,\ 13\) y frecuencias \(4,\ 2,\ 1\).
En una tabla agrupada, las marcas de clase son \(12,\ 17,\ 22\) y las frecuencias son \(3,\ 4,\ 3\). Calcula la media aproximada.
Explica por qué en datos agrupados la media es una aproximación y no un valor exacto.
Si la suma \(\sum x_if_i\) es 180 y el total de datos es 12, calcula la media agrupada.
En una distribución con marcas de clase \(5,\ 15,\ 25,\ 35\) y frecuencias \(2,\ 4,\ 3,\ 1\), calcula la media aproximada.
Si una tabla tiene intervalos \(10{-}19,\ 20{-}29,\ 30{-}39\), determina sus marcas de clase.
En una tabla agrupada, el total de frecuencias es 30 y la suma de los productos \(x_if_i\) es 690. ¿Cuál es la media?
Compara las expresiones “media exacta” y “media aproximada” en el contexto estadístico.
Una tabla tiene marcas de clase \(4{,}5,\ 14{,}5,\ 24{,}5\) y frecuencias \(6,\ 8,\ 6\). Calcula la media aproximada.
¿Qué papel cumple la marca de clase en el cálculo de la media agrupada?
En una tabla agrupada, ¿qué ocurre con la media aproximada si aumentan las frecuencias de los intervalos altos? Explica brevemente.

💡 Pista para PAES

En preguntas de media agrupada, revisa siempre tres cosas: la marca de clase, el producto \(x_i\cdot f_i\) y el total de frecuencias. Muchos errores aparecen por olvidar uno de esos pasos.

Ejercicios tipo PAES

En una tabla agrupada, las marcas de clase son \(5,\ 15,\ 25\) y las frecuencias son \(2,\ 3,\ 5\). La media aproximada es:
1. \(18\)
2. \(20\)
3. \(17\)
4. \(22\)
La razón principal por la que la media en datos agrupados se considera una aproximación es que:
1. las frecuencias siempre son decimales
2. la media no puede calcularse nunca en tablas
3. se reemplazan los datos reales por marcas de clase
4. los intervalos aparentes y reales son distintos
Si en una tabla agrupada se tiene \(\sum x_if_i=360\) y \(n=18\), entonces la media aproximada es:
1. \(22\)
2. \(18\)
3. \(20\)
4. \(24\)
Las marcas de clase de los intervalos \(10{-}19,\ 20{-}29,\ 30{-}39\) son:
1. \(14,\ 24,\ 34\)
2. \(14{,}5,\ 24{,}5,\ 34{,}5\)
3. \(15,\ 25,\ 35\)
4. \(9{,}5,\ 19{,}5,\ 29{,}5\)
En una tabla con marcas de clase \(4,\ 8,\ 12\) y frecuencias \(1,\ 3,\ 2\), el valor de \(\sum x_if_i\) es:
1. \(40\)
2. \(52\)
3. \(32\)
4. \(28\)
Si aumentan las frecuencias de los intervalos con mayor marca de clase, entonces es esperable que la media agrupada:
1. disminuya
2. permanezca igual
3. aumente
4. desaparezca

⚠️ Conclusión importante

La media en datos agrupados es una herramienta muy útil para resumir distribuciones extensas, pero siempre debe interpretarse como una aproximación. En PAES M1 no basta con aplicar la fórmula: también debes comprender por qué el resultado es estimado y qué información lo sustenta.

7. Mediana en datos agrupados

Mediana en datos agrupados [intervalo mediano, cálculo e interpretación] (PAES M1)

Objetivo de la clase: identificar el intervalo mediano en una tabla de datos agrupados, calcular la mediana mediante interpolación e interpretar su significado dentro de una distribución.

Cuando los datos están agrupados en intervalos, ya no conocemos cada valor exacto del conjunto. Por eso, la mediana no se obtiene observando directamente el dato central, sino estimándola dentro del intervalo mediano.

En esta clase aprenderás no solo a ubicar el intervalo que contiene la mediana, sino también a calcular una aproximación de la mediana usando una fórmula específica para datos agrupados.

📐 Idea clave de la mediana en datos agrupados

La mediana es el valor que divide al conjunto en dos partes: aproximadamente el 50% de los datos queda por debajo y aproximadamente el 50% queda por encima.

En datos agrupados, primero se identifica el intervalo mediano usando la frecuencia acumulada y luego se estima la mediana dentro de ese intervalo.

📐 Cómo ubicar el intervalo mediano

Calcula el total de datos \(n\).
Busca el valor: \[ \dfrac{n}{2} \]
Observa la frecuencia acumulada y localiza el primer intervalo cuya frecuencia acumulada iguala o supera a \(\dfrac{n}{2}\).
Ese intervalo es el intervalo mediano.

📐 Fórmula de la mediana en datos agrupados

Una vez identificado el intervalo mediano, la mediana se estima con:

\[ \mathrm{Me}\approx L_i+\left(\dfrac{\frac{n}{2}-F_{anterior}}{f_m}\right)\cdot a \]

donde:

\(L_i\): límite inferior real del intervalo mediano,
\(n\): total de datos,
\(F_{anterior}\): frecuencia acumulada anterior al intervalo mediano,
\(f_m\): frecuencia del intervalo mediano,
\(a\): amplitud del intervalo.

🤓 ¿Por qué esta fórmula entrega una aproximación?

Porque dentro del intervalo mediano no conocemos la ubicación exacta de cada dato. La fórmula supone que los datos del intervalo están distribuidos de manera uniforme y, con esa idea, estima dónde se encuentra el valor central.

💡 Estrategia práctica

Calcula \(\dfrac{n}{2}\).
Encuentra el intervalo mediano con la frecuencia acumulada.
Extrae los 4 datos clave: \(L_i\), \(F_{anterior}\), \(f_m\) y \(a\).
Reemplaza en la fórmula con cuidado.
Interpreta el resultado dentro del contexto.

Ejemplo 1: encontrar el intervalo mediano

La siguiente tabla resume los tiempos de lectura, en minutos, de 20 estudiantes:

Intervalo aparente	Intervalo real	\(f\)	\(F\)
\(0{-}9\)	\(-0{,}5 \le x < 9{,}5\)	3	3
\(10{-}19\)	\(9{,}5 \le x < 19{,}5\)	5	8
\(20{-}29\)	\(19{,}5 \le x < 29{,}5\)	6	14
\(30{-}39\)	\(29{,}5 \le x < 39{,}5\)	4	18
\(40{-}49\)	\(39{,}5 \le x < 49{,}5\)	2	20

Como el total es \(n=20\), buscamos:

\[ \dfrac{20}{2}=10 \]

La frecuencia acumulada pasa de 8 a 14 en el intervalo \(20{-}29\), por lo tanto ese es el intervalo mediano.

Ejemplo 2: cálculo de la mediana agrupada

Usamos la tabla anterior.

Ya sabemos que el intervalo mediano es \(20{-}29\), cuyo intervalo real es:

\[ 19{,}5 \le x < 29{,}5 \]

Entonces identificamos los datos de la fórmula:

\(L_i=19{,}5\)
\(n=20\)
\(\dfrac{n}{2}=10\)
\(F_{anterior}=8\)
\(f_m=6\)
\(a=10\)

Reemplazamos:

\[ \mathrm{Me}\approx 19{,}5+\left(\dfrac{10-8}{6}\right)\cdot 10 \]

\[ \mathrm{Me}\approx 19{,}5+\left(\dfrac{2}{6}\right)\cdot 10 \]

\[ \mathrm{Me}\approx 19{,}5+3{,}33 \]

\[ \mathrm{Me}\approx 22{,}83 \]

Conclusión: la mediana es aproximadamente \(22{,}83\) minutos.

Ejemplo 3: interpretación de la mediana

El valor \(\mathrm{Me}\approx 22{,}83\) indica que aproximadamente la mitad de los estudiantes tiene tiempos de lectura menores que \(22{,}83\) minutos, y la otra mitad tiene tiempos mayores.

Como se trata de datos agrupados, este valor es una estimación del centro de la distribución.

Ejemplo 4: otro cálculo completo

Observa la siguiente tabla de estaturas de 30 estudiantes:

Intervalo aparente	Intervalo real	\(f\)	\(F\)
\(140{-}149\)	\(139{,}5 \le x < 149{,}5\)	3	3
\(150{-}159\)	\(149{,}5 \le x < 159{,}5\)	8	11
\(160{-}169\)	\(159{,}5 \le x < 169{,}5\)	10	21
\(170{-}179\)	\(169{,}5 \le x < 179{,}5\)	6	27
\(180{-}189\)	\(179{,}5 \le x < 189{,}5\)	3	30

Primero calculamos:

\[ \dfrac{30}{2}=15 \]

La frecuencia acumulada pasa de 11 a 21 en el intervalo \(160{-}169\), por lo tanto ese es el intervalo mediano.

Ahora extraemos los datos:

\(L_i=159{,}5\)
\(F_{anterior}=11\)
\(f_m=10\)
\(a=10\)

Aplicamos la fórmula:

\[ \mathrm{Me}\approx 159{,}5+\left(\dfrac{15-11}{10}\right)\cdot 10 \]

\[ \mathrm{Me}\approx 159{,}5+4 \]

\[ \mathrm{Me}\approx 163{,}5 \]

Interpretación: la estatura mediana es aproximadamente \(163{,}5\) cm.

⚠️ Errores típicos

Confundir el intervalo mediano con el intervalo modal.
Usar el límite inferior aparente en vez del límite inferior real.
Tomar \(F\) del intervalo mediano en lugar de usar la frecuencia acumulada anterior.
Usar mal la amplitud del intervalo.
Creer que la mediana agrupada es exacta y no una aproximación.

🌍 ¿Qué aporta la mediana en datos agrupados?

La mediana permite ubicar el centro de una distribución aun cuando los datos estén resumidos en intervalos. Es especialmente útil cuando interesa describir un valor central sin dejarse influir demasiado por valores extremos.

🤓 Relación con lo aprendido antes

En datos sueltos, la mediana se encuentra buscando el dato central del conjunto ordenado. En datos agrupados, esa idea se mantiene, pero ahora el centro se estima dentro del intervalo mediano usando una interpolación.

Ejercicios de práctica

En una tabla agrupada con \(n=40\), ¿qué valor debes calcular primero para buscar la mediana?
Explica qué es el intervalo mediano.
Si en una tabla el intervalo mediano tiene \(L_i=29{,}5\), \(F_{anterior}=12\), \(f_m=8\), \(a=10\) y \(n=40\), calcula la mediana.
En una distribución con \(n=50\), si la frecuencia acumulada anterior al intervalo mediano es 18 y la frecuencia del intervalo mediano es 12, con \(L_i=39{,}5\) y \(a=10\), calcula la mediana.
¿Por qué en la fórmula se usa la frecuencia acumulada anterior y no la del propio intervalo mediano?
En una tabla agrupada, la mediana quedó aproximadamente en \(24{,}7\). Interpreta ese resultado.
Si el intervalo mediano es \(60{-}69\), con intervalo real \(59{,}5 \le x < 69{,}5\), frecuencia 15, acumulada anterior 20, total 70 y amplitud 10, calcula la mediana.
Explica por qué la mediana agrupada es una aproximación.
¿Qué ocurre con la mediana si el valor \(\dfrac{n}{2}\) cae exactamente al inicio de un intervalo?
¿Qué papel cumple la amplitud del intervalo en la fórmula de la mediana agrupada?
En una tabla, \(n=24\), \(L_i=19{,}5\), \(F_{anterior}=9\), \(f_m=6\), \(a=10\). Calcula la mediana.
Diferencia con tus palabras “encontrar el intervalo mediano” y “calcular la mediana agrupada”.

💡 Pista para PAES

En ejercicios de mediana agrupada, separa mentalmente el proceso en dos partes: primero ubicar el intervalo mediano y luego reemplazar correctamente los datos en la fórmula.

Ejercicios tipo PAES

En una tabla agrupada con \(n=32\), el valor que se busca primero para localizar la mediana es:
1. \(8\)
2. \(32\)
3. \(16\)
4. \(15\)
La fórmula de la mediana agrupada usa:
1. el límite inferior real del intervalo mediano
2. la marca de clase del intervalo modal
3. la frecuencia relativa acumulada final
4. el límite superior aparente del primer intervalo
Si \(n=40\), \(L_i=19{,}5\), \(F_{anterior}=14\), \(f_m=10\) y \(a=10\), la mediana es:
1. \(23{,}5\)
2. \(25{,}5\)
3. \(29{,}5\)
4. \(20{,}5\)
El intervalo mediano es el primer intervalo cuya frecuencia acumulada:
1. es menor que \(\dfrac{n}{2}\)
2. supera o iguala a \(\dfrac{n}{2}\)
3. coincide con la frecuencia simple mayor
4. es exactamente igual a 1
Si en una tabla agrupada la mediana estimada es \(54{,}2\), entonces:
1. ese valor necesariamente aparece en los datos originales
2. el 54,2% de los datos está bajo ese valor
3. aproximadamente la mitad de los datos queda por debajo de ese valor
4. la media debe ser igual a 54,2
En la fórmula de la mediana agrupada, \(F_{anterior}\) representa:
1. la frecuencia del intervalo mediano
2. la frecuencia acumulada anterior al intervalo mediano
3. la frecuencia relativa del último intervalo
4. la suma de todas las frecuencias

⚠️ Conclusión importante

En datos agrupados, la mediana no se limita a ubicar un intervalo: también puede estimarse numéricamente mediante una fórmula. Para responder bien en PAES M1, debes distinguir entre encontrar el intervalo mediano e interpolar dentro de él para obtener la mediana aproximada.

8. Moda en datos agrupados

Moda en datos agrupados [clase modal, fórmula, estimación] (PAES M1)

Objetivo de la clase: identificar la clase modal en una tabla de datos agrupados, estimar la moda mediante una fórmula e interpretar su significado dentro de una distribución.

Cuando los datos están agrupados por intervalos, ya no podemos ver con exactitud cuál es el valor que más se repite. En ese caso, primero identificamos la clase modal, es decir, el intervalo con mayor frecuencia, y luego estimamos la moda usando una fórmula.

En esta clase aprenderás a reconocer la clase modal, a aplicar la fórmula de la moda en datos agrupados y a interpretar el resultado como una estimación del valor más representativo en la zona de mayor concentración de datos.

📐 Idea clave de la moda en datos agrupados

La moda es el valor que aparece con mayor frecuencia. En datos agrupados, como no conocemos los datos exactos uno a uno, no siempre podemos hallar la moda exacta, pero sí podemos identificar la clase modal y estimar un valor modal dentro de ella.

📐 Cómo identificar la clase modal

Observa la columna de frecuencia absoluta \(f\).
Busca el intervalo con mayor frecuencia.
Ese intervalo se llama clase modal.

📐 Fórmula de la moda en datos agrupados

Una vez identificada la clase modal, la moda se estima con:

\[ \mathrm{Mo}\approx L_i+\left(\dfrac{d_1}{d_1+d_2}\right)\cdot a \]

donde:

\(L_i\): límite inferior real de la clase modal,
\(a\): amplitud del intervalo modal,
\(d_1=f_m-f_{anterior}\): diferencia entre la frecuencia modal y la frecuencia anterior,
\(d_2=f_m-f_{siguiente}\): diferencia entre la frecuencia modal y la frecuencia siguiente,
\(f_m\): frecuencia de la clase modal.

🤓 ¿Por qué esta fórmula da una estimación?

Porque la tabla no muestra exactamente cómo se distribuyen los datos dentro de la clase modal. La fórmula usa las frecuencias vecinas para estimar en qué parte del intervalo se concentra más fuertemente la distribución.

💡 Estrategia práctica

Encuentra la clase modal mirando la frecuencia mayor.
Identifica \(L_i\) y la amplitud \(a\).
Calcula \(d_1\) y \(d_2\) comparando la frecuencia modal con la anterior y la siguiente.
Reemplaza con cuidado en la fórmula.
Interpreta el resultado como una aproximación del valor más frecuente.

Ejemplo 1: identificar la clase modal

La siguiente tabla resume los tiempos de práctica, en minutos, de 30 estudiantes:

Intervalo aparente	Intervalo real	\(f\)
\(0{-}9\)	\(-0{,}5 \le x < 9{,}5\)	4
\(10{-}19\)	\(9{,}5 \le x < 19{,}5\)	7
\(20{-}29\)	\(19{,}5 \le x < 29{,}5\)	10
\(30{-}39\)	\(29{,}5 \le x < 39{,}5\)	6
\(40{-}49\)	\(39{,}5 \le x < 49{,}5\)	3

La frecuencia mayor es \(10\), que corresponde al intervalo \(20{-}29\).

Conclusión: la clase modal es \(20{-}29\).

Ejemplo 2: cálculo de la moda agrupada

Usamos la tabla anterior.

La clase modal es \(20{-}29\), cuyo intervalo real es:

\[ 19{,}5 \le x < 29{,}5 \]

Entonces:

\(L_i=19{,}5\)
\(a=10\)
\(f_m=10\)
\(f_{anterior}=7\)
\(f_{siguiente}=6\)

Calculamos las diferencias:

\[ d_1=10-7=3 \]

\[ d_2=10-6=4 \]

Ahora reemplazamos en la fórmula:

\[ \mathrm{Mo}\approx 19{,}5+\left(\dfrac{3}{3+4}\right)\cdot 10 \]

\[ \mathrm{Mo}\approx 19{,}5+\left(\dfrac{3}{7}\right)\cdot 10 \]

\[ \mathrm{Mo}\approx 19{,}5+4{,}29 \]

\[ \mathrm{Mo}\approx 23{,}79 \]

Conclusión: la moda estimada es aproximadamente \(23{,}79\) minutos.

Ejemplo 3: interpretación de la moda agrupada

El valor \(\mathrm{Mo}\approx 23{,}79\) indica que el punto de mayor concentración de datos está aproximadamente cerca de \(23{,}79\) minutos.

Eso no significa que ese valor aparezca exactamente en la tabla original, sino que representa una estimación del valor más frecuente dentro de la zona modal.

Ejemplo 4: otro cálculo completo

Observa la siguiente tabla de estaturas de 40 estudiantes:

Intervalo aparente	Intervalo real	\(f\)
\(140{-}149\)	\(139{,}5 \le x < 149{,}5\)	5
\(150{-}159\)	\(149{,}5 \le x < 159{,}5\)	11
\(160{-}169\)	\(159{,}5 \le x < 169{,}5\)	14
\(170{-}179\)	\(169{,}5 \le x < 179{,}5\)	7
\(180{-}189\)	\(179{,}5 \le x < 189{,}5\)	3

La mayor frecuencia es \(14\), así que la clase modal es \(160{-}169\).

Identificamos los datos:

\(L_i=159{,}5\)
\(a=10\)
\(f_m=14\)
\(f_{anterior}=11\)
\(f_{siguiente}=7\)

Calculamos:

\[ d_1=14-11=3 \]

\[ d_2=14-7=7 \]

Aplicamos la fórmula:

\[ \mathrm{Mo}\approx 159{,}5+\left(\dfrac{3}{3+7}\right)\cdot 10 \]

\[ \mathrm{Mo}\approx 159{,}5+3 \]

\[ \mathrm{Mo}\approx 162{,}5 \]

Interpretación: la estatura modal estimada es aproximadamente \(162{,}5\) cm.

Ejemplo 5: comparación entre clase modal y moda estimada

La clase modal solo indica en qué intervalo está la mayor concentración de datos.

La moda estimada, en cambio, intenta ubicar un valor específico dentro de ese intervalo.

Concepto	Qué indica
Clase modal	El intervalo con mayor frecuencia
Moda estimada	Un valor aproximado de máxima concentración dentro de ese intervalo

⚠️ Errores típicos

Confundir la clase modal con el intervalo mediano.
Usar el límite inferior aparente en vez del límite inferior real.
Calcular mal \(d_1\) y \(d_2\).
Creer que la moda estimada es exacta.
Olvidar que la clase modal debe compararse con la frecuencia anterior y con la siguiente.

🌍 ¿Qué aporta la moda en datos agrupados?

La moda agrupada ayuda a identificar la zona donde los datos se concentran con mayor fuerza. Esto es útil en contextos como tallas, edades, tiempos o puntajes, cuando interesa reconocer el tramo más frecuente de la distribución y estimar un valor representativo dentro de él.

🤓 Relación con lo aprendido antes

En datos sueltos, la moda es el valor que más se repite. En datos agrupados, esa idea se transforma en dos pasos: primero se localiza la clase modal y luego se estima la moda usando las frecuencias vecinas para ubicar mejor el punto de máxima concentración.

Ejercicios de práctica

Explica qué es la clase modal en una tabla de datos agrupados.
En una tabla, las frecuencias son \(4,\ 9,\ 12,\ 7,\ 3\). ¿Cuál es la clase modal?
Si una clase modal tiene \(f_m=15\), la frecuencia anterior es 11 y la siguiente es 9, calcula \(d_1\) y \(d_2\).
En un intervalo modal con límite inferior real \(29{,}5\), amplitud 10, \(d_1=4\) y \(d_2=6\), calcula la moda estimada.
Explica por qué la moda agrupada es una estimación y no un valor exacto.
Si la clase modal es \(50{-}59\), su intervalo real es \(49{,}5 \le x < 59{,}5\), \(f_m=18\), \(f_{anterior}=12\) y \(f_{siguiente}=10\), calcula la moda.
¿Qué diferencia hay entre clase modal y moda estimada?
En una tabla agrupada, si la frecuencia anterior y la siguiente a la clase modal son iguales, ¿qué ocurre con la fracción \(\dfrac{d_1}{d_1+d_2}\)?
Si \(L_i=19{,}5\), \(a=10\), \(f_m=14\), \(f_{anterior}=10\), \(f_{siguiente}=12\), calcula la moda estimada.
Interpreta una moda agrupada aproximada de \(72{,}4\).
En una tabla, ¿por qué no basta con saber solo la frecuencia modal para calcular la moda agrupada?
¿Qué papel cumplen las frecuencias vecinas en la fórmula de la moda agrupada?

💡 Pista para PAES

En ejercicios de moda agrupada, separa el proceso en tres partes: primero identifica la clase modal, después calcula bien \(d_1\) y \(d_2\), y recién entonces reemplaza en la fórmula.

Ejercicios tipo PAES

En una tabla agrupada, la clase modal es:
1. la que contiene la mediana
2. la que tiene mayor amplitud
3. la que tiene mayor frecuencia
4. la última clase de la tabla
En la fórmula de la moda agrupada, \(d_1\) representa:
1. la diferencia entre la frecuencia modal y la frecuencia anterior
2. la suma de las dos frecuencias vecinas
3. la amplitud del intervalo modal
4. la marca de clase modal
Si \(L_i=39{,}5\), \(a=10\), \(f_m=18\), \(f_{anterior}=14\) y \(f_{siguiente}=12\), la moda estimada es:
1. \(43{,}5\)
2. \(45{,}5\)
3. \(44{,}5\)
4. \(46{,}17\)
La moda en datos agrupados se considera una estimación porque:
1. la frecuencia siempre es decimal
2. se desconoce la distribución exacta de los datos dentro del intervalo modal
3. la clase modal coincide siempre con la mediana
4. no existe límite inferior real
Si en una tabla agrupada la clase modal tiene frecuencias vecinas iguales, entonces la moda estimada queda:
1. al inicio del intervalo modal
2. en el centro del intervalo modal
3. fuera del intervalo modal
4. en el límite superior real del intervalo siguiente
En la fórmula de la moda agrupada, el valor \(a\) representa:
1. la frecuencia acumulada anterior
2. la amplitud del intervalo modal
3. la suma de frecuencias
4. la cantidad total de clases

⚠️ Conclusión importante

En datos agrupados, la moda no se limita a ubicar la clase de mayor frecuencia. También puede estimarse numéricamente usando una fórmula que considera la clase modal y sus frecuencias vecinas. Para responder bien en PAES M1, debes distinguir entre reconocer la clase modal e interpretar la moda estimada como una aproximación del valor más frecuente.

9. Comparación entre medidas centrales [datos sueltos vs agrupados, pérdida de información]

Comparación entre medidas centrales [datos sueltos vs agrupados, pérdida de información] (PAES M1)

Objetivo de la clase: comparar la media, la mediana y la moda en datos sueltos, en tablas de frecuencias simples y en datos agrupados por intervalos, reconociendo cómo cambia la precisión de las medidas cuando la información se resume.

Hasta ahora has aprendido a calcular media, mediana y moda en distintos formatos: datos sueltos, tablas de frecuencia simple y datos agrupados por intervalos. En esta clase el foco estará en comparar qué ocurre cuando una misma información se organiza de maneras distintas.

La idea central es importante: mientras más se resume la información, más fácil puede ser analizarla, pero también se pierde detalle. Por eso, en datos agrupados por intervalos, las medidas centrales suelen ser aproximadas.

🤓 Idea central

No es lo mismo trabajar con datos sueltos, con una tabla de frecuencias simple o con datos agrupados en intervalos. En los datos sueltos conservamos toda la información original. En una tabla simple seguimos teniendo exactitud, pero la información ya está resumida. En datos agrupados, en cambio, ganamos orden y rapidez de lectura, pero perdemos precisión, porque reemplazamos muchos datos por intervalos y marcas de clase.

⚠️ Importante

En los ejercicios con intervalos distinguiremos entre intervalo aparente e intervalo real. Por ejemplo, el intervalo aparente \(50{-}59\) corresponde al intervalo real \(49{,}5 \le x < 59{,}5\).

📐 Recordatorio mínimo de fórmulas

Media en tabla de frecuencias simple:

\[ \bar{x}=\frac{\sum x_i f_i}{\sum f_i} \]

Media en datos agrupados:

\[ \bar{x}\approx\frac{\sum f_i x_i}{\sum f_i} \]

Mediana en datos agrupados:

\[ Me \approx L_i+\left(\frac{\frac{N}{2}-F_{anterior}}{f_m}\right)a \]

Moda en datos agrupados:

\[ Mo \approx L_i+\left(\frac{d_1}{d_1+d_2}\right)a \]

💡 Qué debes mirar al comparar

Si el valor obtenido es exacto o aproximado.
Si la medida conserva bien el centro del conjunto.
Qué información se pierde al pasar de datos sueltos a intervalos.
Qué ventaja se gana al resumir muchos datos en una tabla.

Ejemplo guiado: misma información, distinto nivel de resumen

Considera los siguientes datos sueltos:

\[ 2,\ 3,\ 1,\ 4,\ 2,\ 5,\ 3,\ 2,\ 4,\ 1,\ 3,\ 2 \]

Si trabajamos con los datos sueltos:

podemos ordenarlos,
identificar exactamente el dato central,
y reconocer con precisión el valor más frecuente.

Ordenando:

\[ 1,\ 1,\ 2,\ 2,\ 2,\ 2,\ 3,\ 3,\ 3,\ 4,\ 4,\ 5 \]

Moda: \(2\)

Mediana: como hay 12 datos, se promedian el 6.° y el 7.°:

\[ Me=\frac{2+3}{2}=2{,}5 \]

Media:

\[ \bar{x}=\frac{2+3+1+4+2+5+3+2+4+1+3+2}{12}=\frac{32}{12}\approx 2{,}67 \]

Si ahora construimos una tabla de frecuencia simple, las medidas siguen siendo exactas, porque no hemos perdido los valores originales: solo los hemos resumido.

Si agrupamos en intervalos, por ejemplo \(1{-}2\), \(3{-}4\), \(5{-}6\), entonces ya no trabajamos con cada dato exacto, sino con grupos de datos. Ahí las medidas dejan de ser exactas y pasan a ser estimaciones.

Ejercicio 1: desde datos sueltos a tabla de frecuencias simple

En un curso se registró cuántos mensajes enviaron los estudiantes durante un día. Los resultados fueron:

\[ 2,\ 3,\ 1,\ 4,\ 2,\ 5,\ 3,\ 2,\ 4,\ 1,\ 3,\ 2,\ 6,\ 4,\ 3,\ 2,\ 5,\ 3,\ 4,\ 2,\ 1,\ 3,\ 2,\ 4,\ 3 \]

Desarrolla lo siguiente:

Ordena los datos.
Construye una tabla de frecuencias con los datos dados.
Calcula la media.
Determina la moda.
Determina la mediana usando la frecuencia acumulada.
Compara las medidas obtenidas desde los datos sueltos y desde la tabla. ¿Cambian o no cambian?

Número de mensajes \(x_i\)	Frecuencia \(f_i\)	\(x_i \cdot f_i\)	Frecuencia acumulada
1
2
3
4
5
6
Total

Luego responde:

¿Cuál es el valor que más se repite?
¿Cuál es el dato central del conjunto?
¿Qué información aporta la frecuencia acumulada para hallar la mediana?
¿Se perdió información al pasar de los datos sueltos a la tabla simple?

Datos ordenados:
\[ 1,\ 1,\ 1,\ 2,\ 2,\ 2,\ 2,\ 2,\ 2,\ 2,\ 3,\ 3,\ 3,\ 3,\ 3,\ 3,\ 3,\ 4,\ 4,\ 4,\ 4,\ 4,\ 5,\ 5,\ 6 \]
Tabla completa:

\(x_i\) \(f_i\) \(x_i \cdot f_i\) Frecuencia acumulada

1 3 3 3

2 7 14 10

3 7 21 17

4 5 20 22

5 2 10 24

6 1 6 25

Total 25 74 25
Media: \[ \bar{x}=\frac{74}{25}=2{,}96 \]
Moda: los valores de mayor frecuencia son \(2\) y \(3\), porque ambos aparecen 7 veces.
El conjunto es bimodal.
Mediana: como hay 25 datos, la posición central es: \[ \frac{25+1}{2}=13 \] La frecuencia acumulada llega a 10 en el valor 2 y a 17 en el valor 3, por lo tanto el dato 13 corresponde a \(3\).
\[ Me=3 \]
Las medidas obtenidas desde los datos sueltos y desde la tabla simple no cambian, porque la tabla simple solo resume la información exacta.
Los valores que más se repiten son \(2\) y \(3\).
El dato central es \(3\).
La frecuencia acumulada permite ubicar la posición central sin tener que reescribir todos los datos ordenados.
No se pierde información esencial, porque seguimos trabajando con los mismos valores exactos, solo más organizados.

\(x_i\)	\(f_i\)	\(x_i \cdot f_i\)	Frecuencia acumulada
1	3	3	3
2	7	14	10
3	7	21	17
4	5	20	22
5	2	10	24
6	1	6	25
Total	25	74	25

Ejercicio 2: agrupar los mismos datos y comparar las medidas

Usa los mismos datos del ejercicio anterior, pero ahora agrúpalos en los siguientes intervalos:

\[ 1{-}2,\qquad 3{-}4,\qquad 5{-}6 \]

Desarrolla lo siguiente:

Completa la tabla de frecuencias agrupadas.
Escribe los intervalos reales.
Calcula la marca de clase de cada intervalo.
Calcula la media agrupada.
Determina la mediana agrupada.
Determina la moda agrupada.
Compara estos resultados con los obtenidos en el ejercicio 1.

Intervalo aparente	Intervalo real	Marca de clase \(x_i\)	Frecuencia \(f_i\)	\(f_i \cdot x_i\)	Frecuencia acumulada
\(1{-}2\)
\(3{-}4\)
\(5{-}6\)
Total

Luego responde:

¿Cuál es la clase modal?
¿Cuál es la clase mediana?
¿La media agrupada coincide exactamente con la media de los datos sueltos?
¿Qué información se perdió al agrupar?
¿Qué ocurrió con la moda al pasar de datos sueltos a datos agrupados?

Tabla completa:

Intervalo aparente	Intervalo real	Marca de clase \(x_i\)	\(f_i\)	\(f_i\cdot x_i\)	Frecuencia acumulada
\(1{-}2\)	\(0{,}5 \le x < 2{,}5\)	\(1{,}5\)	10	15	10
\(3{-}4\)	\(2{,}5 \le x < 4{,}5\)	\(3{,}5\)	12	42	22
\(5{-}6\)	\(4{,}5 \le x < 6{,}5\)	\(5{,}5\)	3	16{,}5	25
Total			25	73{,}5	25

Media agrupada: \[ \bar{x}\approx \frac{73{,}5}{25}=2{,}94 \]
Mediana agrupada:
Como \(n=25\), \[ \frac{25}{2}=12{,}5 \] La clase mediana es \(3{-}4\), porque la frecuencia acumulada pasa de 10 a 22. \[ Me \approx 2{,}5+\left(\frac{12{,}5-10}{12}\right)\cdot 2 \] \[ Me \approx 2{,}5+\frac{2{,}5}{12}\cdot 2 \] \[ Me \approx 2{,}92 \]
Moda agrupada:
La clase modal es \(3{-}4\), porque tiene la mayor frecuencia: \(12\). \[ d_1=12-10=2,\qquad d_2=12-3=9 \] \[ Mo\approx 2{,}5+\left(\frac{2}{2+9}\right)\cdot 2 \] \[ Mo\approx 2{,}5+\frac{4}{11} \] \[ Mo\approx 2{,}86 \]
La clase modal es \(3{-}4\).
La clase mediana es \(3{-}4\).
No, la media agrupada no coincide exactamente: se aproxima a la media real.
Se perdió el detalle exacto de cada dato individual. Ahora solo sabemos cuántos datos hay dentro de cada intervalo.
En los datos sueltos la moda era bimodal (\(2\) y \(3\)). Al agrupar, esa información fina se pierde y aparece una sola clase modal, \(3{-}4\). Esta es una muestra clara de pérdida de información.

⚠️ Observación importante

Al agrupar datos, la interpretación de la moda puede cambiar bastante. En este caso, los datos sueltos son bimodales, pero al agrupar se obtiene una única clase modal. Esto muestra que agrupar facilita el análisis, pero puede ocultar detalles importantes del conjunto original.

Ejercicio 3: segundo caso de datos agrupados

Los siguientes puntajes corresponden a 24 estudiantes en una prueba:

\[ 52,\ 64,\ 66,\ 68,\ 69,\ 70,\ 72,\ 72,\ 73,\ 74,\ 75,\ 75,\ 76,\ 77,\ 78,\ 78,\ 79,\ 80,\ 82,\ 84,\ 85,\ 88,\ 90,\ 92 \]

Desarrolla lo siguiente:

Agrupa los datos en los intervalos dados.
Completa la columna de intervalo real.
Calcula la marca de clase de cada intervalo.
Completa la frecuencia, el producto \(f_i \cdot x_i\) y la frecuencia acumulada.
Calcula la media agrupada.
Determina la mediana agrupada.
Determina la moda agrupada.
Explica por qué estas tres medidas son aproximadas.

Intervalo aparente	Intervalo real	Marca de clase \(x_i\)	Frecuencia \(f_i\)	\(f_i \cdot x_i\)	Frecuencia acumulada
50–59
60–69
70–79
80–89
90–99
Total

Luego responde:

¿Cuál es la clase mediana?
¿Cuál es la clase modal?
¿Qué diferencia observas entre intervalo aparente e intervalo real?
¿Por qué la media agrupada no coincide necesariamente con la media real de los datos?

Tabla completa:

Intervalo aparente	Intervalo real	Marca de clase \(x_i\)	\(f_i\)	\(f_i\cdot x_i\)	Frecuencia acumulada
50–59	\(49{,}5 \le x < 59{,}5\)	\(54{,}5\)	1	54{,}5	1
60–69	\(59{,}5 \le x < 69{,}5\)	\(64{,}5\)	4	258	5
70–79	\(69{,}5 \le x < 79{,}5\)	\(74{,}5\)	12	894	17
80–89	\(79{,}5 \le x < 89{,}5\)	\(84{,}5\)	5	422{,}5	22
90–99	\(89{,}5 \le x < 99{,}5\)	\(94{,}5\)	2	189	24
Total			24	1818	24

Media agrupada: \[ \bar{x}\approx \frac{1818}{24}=75{,}75 \]
Mediana agrupada:
\[ \frac{24}{2}=12 \] La clase mediana es \(70{-}79\), porque la frecuencia acumulada pasa de 5 a 17. \[ Me\approx 69{,}5+\left(\frac{12-5}{12}\right)\cdot 10 \] \[ Me\approx 69{,}5+5{,}83 \] \[ Me\approx 75{,}33 \]
Moda agrupada:
La clase modal es \(70{-}79\), porque tiene frecuencia 12. \[ d_1=12-4,\qquad d_2=12-5 \] \[ d_1=8,\qquad d_2=7 \] \[ Mo\approx 69{,}5+\left(\frac{8}{8+7}\right)\cdot 10 \] \[ Mo\approx 69{,}5+5{,}33 \] \[ Mo\approx 74{,}83 \]
La clase mediana es \(70{-}79\).
La clase modal es \(70{-}79\).
El intervalo aparente es el que se escribe en la tabla, mientras que el real ajusta los límites para representar correctamente la continuidad de los datos.
Porque la media agrupada usa marcas de clase en lugar de los valores exactos originales.

🌍 ¿Qué enseña esta comparación?

En estudios reales, muchas veces no se trabaja con los datos exactos, sino con tablas resumidas o con intervalos. Eso permite analizar grandes cantidades de información, pero obliga a aceptar que algunas medidas ya no son exactas. Comprender esa diferencia es clave para interpretar bien promedios, medianas y modas en contextos reales.

Cierre y reflexión

¿Qué diferencia hay entre trabajar con datos sueltos, una tabla de frecuencias simple y una tabla agrupada en intervalos?
¿En cuál de esas tres formas se conserva mejor la información original?
¿En cuál de esas tres formas es más exacto el cálculo de la media, la moda y la mediana?
¿Por qué se dice que en datos agrupados las medidas son aproximadas?
¿Qué ventaja tiene, a pesar de eso, trabajar con datos agrupados cuando hay muchos valores?

10. Sesgo y valores extremos [cuándo la media representa bien y cuándo no] (PAES M1)

Sesgo y valores extremos [cuándo la media representa bien y cuándo no] (PAES M1)

Objetivo de la clase: analizar críticamente la media en distintos conjuntos de datos, reconociendo cuándo representa bien al grupo y cuándo se ve afectada por el sesgo o por valores extremos, en comparación con la mediana y la moda.

Hasta ahora has aprendido a calcular media, mediana y moda. En esta clase el foco cambia: ya no basta con calcular, sino que importa interpretar si una medida realmente describe bien al conjunto.

En particular, estudiaremos qué ocurre cuando los datos son equilibrados y qué pasa cuando aparece sesgo o un valor extremo. Verás que la media puede ser muy útil, pero no siempre representa bien la situación.

📐 Ideas clave

Media: considera todos los datos del conjunto.
Mediana: representa el valor central una vez ordenados los datos.
Moda: indica el valor que más se repite.
Valor extremo: dato muy alejado del resto.
Sesgo: ocurre cuando la distribución se extiende más hacia un lado que hacia el otro.

🤓 Idea central

La media es sensible a los valores extremos, porque usa todos los datos. La mediana suele resistir mejor esos cambios, porque depende de la posición central. La moda, en cambio, se relaciona con la frecuencia y puede mantenerse igual aunque cambien algunos valores aislados.

💡 Señales para sospechar que la media no representa bien

hay uno o pocos valores muy grandes o muy pequeños,
la mayoría de los datos está concentrada en una zona, pero la media queda lejos de ella,
la distribución está claramente cargada hacia un lado.

Ejemplo 1: conjunto equilibrado

Considera los datos:

\[ 4,\ 5,\ 5,\ 6,\ 6,\ 7,\ 7 \]

Media:

\[ \bar{x}=\frac{4+5+5+6+6+7+7}{7}=\frac{40}{7}\approx 5{,}71 \]

Mediana: el dato central es \(6\).

Moda: hay dos modas: \(5\) y \(7\).

Interpretación: los datos están bastante equilibrados, por lo que la media y la mediana quedan cercanas. En un conjunto así, la media representa razonablemente bien al grupo.

Ejemplo 2: efecto de un valor extremo alto

Ahora observa:

\[ 4,\ 5,\ 5,\ 6,\ 6,\ 7,\ 20 \]

Media:

\[ \bar{x}=\frac{4+5+5+6+6+7+20}{7}=\frac{53}{7}\approx 7{,}57 \]

Mediana: el dato central sigue siendo \(6\).

Moda: las modas siguen siendo \(5\) y \(6\).

Interpretación: el valor 20 arrastra la media hacia arriba. La mayoría de los datos está entre 4 y 7, pero la media queda en \(7{,}57\), lejos del centro real del grupo. Aquí la mediana representa mejor al conjunto.

Ejemplo 3: efecto de un valor extremo bajo

Considera ahora:

\[ 1,\ 8,\ 8,\ 9,\ 9,\ 10,\ 10 \]

Media:

\[ \bar{x}=\frac{1+8+8+9+9+10+10}{7}=\frac{55}{7}\approx 7{,}86 \]

Mediana: el dato central es \(9\).

Moda: hay varias modas: \(8,\ 9,\ 10\).

Interpretación: el valor 1 baja la media. En cambio, la mediana sigue ubicada en el centro del grupo. Esto muestra otra vez que la media puede dejar de representar bien cuando aparece un valor extremo.

Ejemplo 4: sesgo hacia la derecha

Supongamos el siguiente conjunto:

\[ 2,\ 2,\ 3,\ 3,\ 3,\ 4,\ 10 \]

Media:

\[ \bar{x}=\frac{2+2+3+3+3+4+10}{7}=\frac{27}{7}\approx 3{,}86 \]

Mediana: \(3\).

Moda: \(3\).

Interpretación: la distribución tiene una cola hacia la derecha, porque aparece un valor alto que aleja la media del centro. En una situación así, la media queda mayor que la mediana.

Ejemplo 5: misma media, distinto comportamiento

Observa estos dos conjuntos:

Conjunto A	Conjunto B
\(8,\ 8,\ 8,\ 8,\ 8\)	\(2,\ 5,\ 8,\ 11,\ 14\)

En ambos casos:

\[ \bar{x}=8 \]

Pero el significado no es el mismo.

En el conjunto A todos los datos coinciden con la media. En el conjunto B la media es 8, pero los datos están mucho más dispersos.

Interpretación: tener la misma media no significa que dos grupos se comporten igual. Por eso, mirar solo el promedio puede ser insuficiente.

🌍 Un caso muy común en la vida real

En temas como ingresos, precios o tiempos de espera, suele haber valores extremos. Por eso, decir solo “el promedio fue...” puede llevar a conclusiones engañosas. En muchos de esos contextos conviene acompañar la media con la mediana, o incluso preferir la mediana como descriptor principal.

⚠️ No confundas estas ideas

Que la media sea correcta no significa que sea la mejor descripción del grupo.
Que la mediana sea más útil en un contexto no significa que la media esté mal calculada.
Que la moda exista no significa que sea siempre la medida más informativa.

Ejercicios de práctica

Calcula media, mediana y moda de \(3,\ 4,\ 4,\ 5,\ 5,\ 6,\ 7\). Luego indica si la media representa bien al grupo.
Calcula media, mediana y moda de \(3,\ 4,\ 4,\ 5,\ 5,\ 6,\ 20\). Luego compara con el ejercicio anterior.
Explica con tus palabras qué es un valor extremo.
En el conjunto \(2,\ 2,\ 3,\ 3,\ 4,\ 4,\ 12\), ¿qué medida representa mejor el centro del grupo? Justifica.
Construye un conjunto de 5 datos en el que la media y la mediana sean muy distintas.
Construye un conjunto de 5 datos en el que la media represente bien al grupo.
Compara los conjuntos \(5,\ 5,\ 5,\ 5,\ 5\) y \(1,\ 3,\ 5,\ 7,\ 9\). ¿Qué tienen en común y en qué se diferencian?
Si en un grupo la mayoría de los datos está cerca de 10, pero hay un dato igual a 100, ¿qué medida central puede verse más afectada?
En una tienda se registran las ventas diarias: \(20,\ 22,\ 21,\ 19,\ 20,\ 95\). Calcula media y mediana. Luego indica cuál conviene usar para describir un día típico.
En un curso, las edades son \(14,\ 14,\ 15,\ 15,\ 15,\ 16,\ 30\). Calcula media, mediana y moda. Luego explica cuál describe mejor al grupo.
Explica qué significa que una distribución esté sesgada hacia la derecha.
Explica qué significa que dos grupos tengan la misma media, pero no necesariamente el mismo comportamiento.

💡 Pista para interpretar

Si la media queda lejos de la zona donde está la mayoría de los datos, probablemente no sea la mejor medida para describir al grupo.

Ejercicios tipo PAES

Un conjunto de datos es \(4,\ 5,\ 5,\ 6,\ 6,\ 7,\ 25\). ¿Cuál afirmación es más adecuada?
1. La media representa bien al grupo porque usa todos los datos.
2. La mediana puede representar mejor el centro del grupo que la media.
3. La moda siempre reemplaza a la mediana.
4. La media y la mediana deben ser iguales.
En un conjunto con fuerte presencia de valores extremos, la medida más sensible a esos cambios es:
1. la moda
2. la mediana
3. la media
4. ninguna de las tres
Dos grupos tienen la misma media. A partir de eso se puede concluir que:
1. los dos grupos tienen exactamente los mismos datos
2. los dos grupos necesariamente tienen la misma mediana
3. los dos grupos pueden ser diferentes aunque compartan la misma media
4. los dos grupos tienen la misma moda
En un curso, los puntajes son \(500,\ 510,\ 520,\ 530,\ 980\). Si se quiere describir el puntaje central del grupo sin dejarse influir demasiado por el valor 980, conviene usar:
1. la moda
2. la mediana
3. la media
4. la frecuencia acumulada
Si una distribución está sesgada hacia la derecha, es esperable que:
1. la media tienda a quedar mayor que la mediana
2. la media tienda a quedar menor que la mediana
3. la moda desaparezca siempre
4. la mediana deje de existir
¿En cuál de los siguientes contextos la media suele ser un buen resumen?
1. tallas de ropa más vendidas
2. respuestas a una encuesta de transporte
3. puntajes de un grupo equilibrado sin valores extremos notorios
4. precios con un valor muy exagerado respecto del resto

⚠️ Conclusión importante

La media no es “mala” cuando hay valores extremos: simplemente puede dejar de ser el mejor resumen del grupo. En PAES M1 es clave reconocer cuándo una medida central describe bien el contexto y cuándo conviene preferir otra.

11. Interpretación en contexto y decisión según situación [medidas centrales] (PAES M1)

Interpretación en contexto y decisión según situación [medidas centrales] (PAES M1)

Objetivo de la clase: resolver situaciones contextualizadas eligiendo y justificando la medida de tendencia central más adecuada, a partir de datos sueltos, tablas de frecuencias simples y tablas agrupadas.

En esta clase el foco no estará en aprender una fórmula nueva, sino en usar lo ya aprendido para tomar decisiones estadísticas con sentido. En muchos problemas no basta con calcular media, mediana o moda: también hay que decidir cuál de ellas responde mejor a la pregunta del contexto.

Por eso, aquí trabajaremos con situaciones donde lo importante será interpretar qué se quiere describir: un promedio global, un valor central resistente a extremos o el valor más frecuente.

📐 Criterios para decidir qué medida usar

Media: conviene cuando se quiere resumir el comportamiento global de un conjunto cuantitativo y no hay valores extremos que distorsionen demasiado.
Mediana: conviene cuando interesa el valor central del grupo y se quiere resistir mejor el efecto de valores muy altos o muy bajos.
Moda: conviene cuando interesa saber qué valor o categoría aparece con mayor frecuencia.

💡 Preguntas guía antes de responder

¿El problema pide un promedio general?
¿El problema pide un valor típico o central sin dejarse arrastrar por extremos?
¿El problema pide identificar lo que más se repite?
¿Los datos son numéricos o son categorías?

🤓 Idea central

Elegir bien una medida central depende del contexto. La media, la mediana y la moda no compiten entre sí: cada una destaca un aspecto distinto del conjunto. En una buena respuesta no basta con nombrar una medida; también hay que justificar por qué esa medida es la más adecuada.

⚠️ Errores frecuentes

Usar la media en datos cualitativos, como tallas, colores o medios de transporte.
Elegir la moda cuando el problema pide describir el centro del grupo.
Elegir la media sin revisar si hay valores extremos.
Responder solo con el nombre de la medida y no justificarla con el contexto.

Ejemplo 1: cuando conviene la media

Las notas de un estudiante en 5 evaluaciones son:

\[ 5{,}8,\ 6{,}0,\ 6{,}1,\ 6{,}2,\ 6{,}4 \]

Media:

\[ \bar{x}=\frac{5{,}8+6{,}0+6{,}1+6{,}2+6{,}4}{5}=\frac{30{,}5}{5}=6{,}1 \]

Mediana: \(6{,}1\)

Moda: no hay moda.

Decisión: aquí conviene la media, porque los datos son cuantitativos, equilibrados y no hay valores extremos que la distorsionen.

Ejemplo 2: cuando conviene la mediana

Los ingresos diarios, en miles de pesos, de 7 personas son:

\[ 18,\ 19,\ 20,\ 20,\ 21,\ 22,\ 60 \]

Media:

\[ \bar{x}=\frac{18+19+20+20+21+22+60}{7}=\frac{180}{7}\approx 25{,}71 \]

Mediana: \(20\)

Moda: \(20\)

Decisión: si se quiere describir el ingreso “típico” del grupo, conviene la mediana, porque el valor 60 eleva demasiado la media.

Ejemplo 3: cuando conviene la moda

Las tallas de zapatillas más vendidas en una tienda fueron:

\[ 37,\ 38,\ 38,\ 38,\ 39,\ 39,\ 40,\ 41 \]

Media:

\[ \bar{x}=\frac{37+38+38+38+39+39+40+41}{8}=\frac{310}{8}=38{,}75 \]

Mediana:

\[ Me=\frac{38+39}{2}=38{,}5 \]

Moda: \(38\)

Decisión: si la tienda quiere saber qué talla conviene reponer, la medida más útil es la moda, porque indica la talla más vendida.

Ejemplo 4: decisión en una tabla agrupada

La siguiente tabla resume tiempos de traslado, en minutos, de 20 estudiantes:

Intervalo	\(f\)	\(F\)
\(0{-}9\)	2	2
\(10{-}19\)	8	10
\(20{-}29\)	7	17
\(30{-}39\)	2	19
\(80{-}89\)	1	20

Aquí aparece un intervalo muy alto al final, lo que sugiere un valor extremo.

Decisión: si se quiere describir el tiempo “típico” de traslado, la mediana suele ser más conveniente que la media, porque resiste mejor la influencia del intervalo extremo \(80{-}89\).

🌍 Aplicaciones en la vida real

La media se usa mucho para resumir notas, temperaturas o puntajes. La mediana es muy útil en ingresos, precios y tiempos cuando hay valores extremos. La moda es ideal para describir tallas, preferencias, respuestas frecuentes y categorías.

Ejercicios de práctica

Con los datos \(1,\ 2,\ 2,\ 3,\ 3,\ 4,\ 4,\ 4,\ 5\), construye una tabla de frecuencias simple, calcula media, mediana y moda, y luego indica cuál medida representa mejor el “valor más habitual”.
Los ingresos diarios, en miles de pesos, de un grupo son \(18,\ 19,\ 20,\ 20,\ 21,\ 22,\ 60\). Calcula media, mediana y moda. Luego justifica qué medida describe mejor el ingreso típico.
Las tallas de polerón pedidas por un curso son \(S,\ M,\ M,\ L,\ M,\ S,\ M,\ L,\ XL\). ¿Qué medida central conviene usar aquí y por qué?
Las notas de un estudiante son \(5{,}0,\ 5{,}5,\ 6{,}0,\ 6{,}0,\ 6{,}5,\ 7{,}0\). Calcula media, mediana y moda. Luego comenta qué sugiere el hecho de que las tres coincidan.
Con los datos \(12,\ 13,\ 15,\ 16,\ 16,\ 17,\ 18,\ 18,\ 18,\ 19,\ 20,\ 21,\ 22,\ 22,\ 23,\ 24,\ 25,\ 26,\ 27,\ 28\), construye una tabla de frecuencias simple y calcula media, mediana y moda exactas. Luego agrupa en los intervalos \(10{-}14,\ 15{-}19,\ 20{-}24,\ 25{-}29\) y compara con las medidas agrupadas.
La siguiente tabla resume tiempos de traslado, en minutos, de 20 estudiantes:

Intervalo	\(f\)	\(F\)
\(0{-}9\)	2	2
\(10{-}19\)	8	10
\(20{-}29\)	7	17
\(30{-}39\)	2	19
\(80{-}89\)	1	20

Calcula media agrupada, mediana agrupada y moda agrupada. Luego justifica cuál medida representa mejor el tiempo “típico” de traslado.
En una encuesta sobre medio de transporte al colegio se obtuvieron estas respuestas: bus, bus, bicicleta, caminar, bus, auto, caminar, bus. ¿Qué medida central tiene sentido usar aquí? Justifica.
Los precios de unas entradas son \(5,\ 5,\ 5,\ 6,\ 6,\ 50\). Calcula media, mediana y moda. Luego indica qué medida conviene usar si se quiere describir el valor central sin que el precio 50 distorsione el resultado.
Observa la siguiente tabla:

Intervalo	\(f\)	\(F\)
\(0{-}9\)	9	9
\(10{-}19\)	3	12
\(20{-}29\)	6	18
\(30{-}39\)	5	23

Indica cuál es la clase modal y cuál es la clase mediana. Luego explica qué pregunta responde mejor la moda y qué pregunta responde mejor la mediana.
Construye un ejemplo propio, con al menos 5 datos, en el que la mediana represente mejor el contexto que la media. Explica por qué.

Tabla:

\(x_i\) \(f_i\) \(x_i\cdot f_i\) \(F\)

1 1 1 1

2 2 4 3

3 2 6 5

4 3 12 8

5 1 5 9

Total 9 28 9

\[ \bar{x}=\frac{28}{9}\approx 3{,}11,\qquad Me=3,\qquad Mo=4 \] Si se pregunta por el valor más habitual, conviene usar la moda, porque identifica el valor más repetido.
\[ \bar{x}=\frac{180}{7}\approx 25{,}71,\qquad Me=20,\qquad Mo=20 \] La mejor medida para describir el ingreso típico es la mediana, porque el valor 60 distorsiona mucho la media.
Aquí conviene usar la moda, porque se trata de categorías y lo que interesa es saber cuál talla aparece más veces. La moda es \(M\).
\[ \bar{x}=\frac{5{,}0+5{,}5+6{,}0+6{,}0+6{,}5+7{,}0}{6}=\frac{36}{6}=6{,}0 \] \[ Me=\frac{6{,}0+6{,}0}{2}=6{,}0,\qquad Mo=6{,}0 \] Que las tres coincidan sugiere que el conjunto está bastante equilibrado alrededor de 6,0.
Medidas exactas:
Total: \[ n=20 \] Suma: \[ 400 \] Entonces: \[ \bar{x}=20 \] Mediana: \[ Me=\frac{19+20}{2}=19{,}5 \] Moda: \[ Mo=18 \] Tabla agrupada:

Intervalo Marca de clase \(f\) \(f\cdot x_i\) \(F\)

\(10{-}14\) 12 2 24 2

\(15{-}19\) 17 8 136 10

\(20{-}24\) 22 6 132 16

\(25{-}29\) 27 4 108 20

Total 20 400 20

\[ \bar{x}\approx \frac{400}{20}=20 \] \[ Me\approx 14{,}5+\left(\frac{10-2}{8}\right)\cdot 5=19{,}5 \] \[ Mo\approx 14{,}5+\left(\frac{8-2}{(8-2)+(8-6)}\right)\cdot 5 \] \[ Mo\approx 14{,}5+\left(\frac{6}{8}\right)\cdot 5=18{,}25 \] La media y la mediana quedan muy cercanas a las exactas, mientras que la moda pasa de \(18\) a una estimación \(18{,}25\). Esto muestra que agrupar puede conservar bastante bien el centro, pero sigue implicando pérdida de precisión.
Media agrupada: Las marcas de clase son \(4{,}5,\ 14{,}5,\ 24{,}5,\ 34{,}5,\ 84{,}5\). \[ \sum f_i x_i = 2\cdot 4{,}5 + 8\cdot 14{,}5 + 7\cdot 24{,}5 + 2\cdot 34{,}5 + 1\cdot 84{,}5 \] \[ \sum f_i x_i = 9+116+171{,}5+69+84{,}5=450 \] \[ \bar{x}\approx \frac{450}{20}=22{,}5 \] Mediana agrupada:
\[ \frac{20}{2}=10 \] El intervalo mediano es \(10{-}19\). \[ Me\approx 9{,}5+\left(\frac{10-2}{8}\right)\cdot 10=19{,}5 \] Moda agrupada:
La clase modal es \(10{-}19\). \[ d_1=8-2=6,\qquad d_2=8-7=1 \] \[ Mo\approx 9{,}5+\left(\frac{6}{7}\right)\cdot 10\approx 18{,}07 \] La mejor medida para el tiempo típico es la mediana, porque hay un valor extremo en \(80{-}89\) que eleva bastante la media.
Aquí la medida adecuada es la moda, porque se trata de categorías. La respuesta más frecuente es bus.
\[ \bar{x}=\frac{5+5+5+6+6+50}{6}=\frac{77}{6}\approx 12{,}83 \] \[ Me=\frac{5+6}{2}=5{,}5,\qquad Mo=5 \] Si se quiere describir el valor central sin que el 50 distorsione el resultado, conviene usar la mediana.
La clase modal es \(0{-}9\), porque tiene frecuencia 9.
Como \(n=23\), \[ \frac{23}{2}=11{,}5 \] La frecuencia acumulada pasa de 9 a 12 en \(10{-}19\), así que la clase mediana es \(10{-}19\). La moda responde mejor la pregunta “¿dónde está la mayor concentración de datos?”.
La mediana responde mejor la pregunta “¿dónde está el centro de la distribución?”.
Una posible respuesta es: \[ 10,\ 11,\ 11,\ 12,\ 60 \] \[ \bar{x}=\frac{104}{5}=20{,}8,\qquad Me=11,\qquad Mo=11 \] La mediana representa mejor el contexto que la media, porque el valor 60 empuja mucho el promedio hacia arriba.

\(x_i\)	\(f_i\)	\(x_i\cdot f_i\)	\(F\)
1	1	1	1
2	2	4	3
3	2	6	5
4	3	12	8
5	1	5	9
Total	9	28	9

Intervalo	Marca de clase	\(f\)	\(f\cdot x_i\)	\(F\)
\(10{-}14\)	12	2	24	2
\(15{-}19\)	17	8	136	10
\(20{-}24\)	22	6	132	16
\(25{-}29\)	27	4	108	20
Total		20	400	20

💡 Pista para PAES

Antes de calcular, pregúntate qué se quiere describir: un promedio global, un valor central resistente o el valor más frecuente. Esa decisión suele ser más importante que la cuenta misma.

Ejercicios tipo PAES

En un grupo, los tiempos de viaje al colegio son \(12,\ 13,\ 14,\ 15,\ 16,\ 18,\ 70\). Si se quiere describir el tiempo “típico” sin que un valor extremo distorsione el resultado, la medida más adecuada es:
1. la moda
2. la mediana
3. la media
4. ninguna de las tres
Una tienda quiere saber qué talla de zapatilla debe reponer con mayor urgencia. La medida central más útil es:
1. la media
2. la mediana
3. la media agrupada
4. la moda
¿Cuál de las siguientes afirmaciones es correcta?
1. En una tabla de frecuencias simple, las medidas siguen siendo exactas; en datos agrupados suelen ser aproximadas.
2. En datos agrupados, la media siempre coincide exactamente con la media real.
3. Agrupar datos no produce ninguna pérdida de información.
4. La moda agrupada siempre coincide con una de las modas exactas.
En una distribución de puntajes bastante equilibrada y sin valores extremos importantes, si se quiere resumir el rendimiento general del curso, conviene usar principalmente:
1. la moda
2. la mediana
3. la media
4. la amplitud
En una encuesta sobre medio de transporte al colegio se obtienen respuestas como “bus”, “bicicleta”, “auto” y “caminar”. La medida central que tiene más sentido usar es:
1. la media
2. la moda
3. la mediana
4. la media agrupada
Al agrupar un conjunto de datos que originalmente era bimodal en intervalos amplios, puede ocurrir que:
1. la media desaparezca
2. la mediana se vuelva exacta
3. la frecuencia acumulada deje de tener sentido
4. se oculte una parte de la información original sobre las modas

⚠️ Cierre importante

En PAES M1 no basta con calcular media, mediana o moda. También debes reconocer cuál conviene usar, qué información entrega y cómo justificar tu elección según la situación que se analiza.

Sitio:	MATEMÁTICAS × Profe Arauco
Curso:	Probabilidades y Estadística Descriptiva e Inferencial
Libro:	Datos , tablas , medidas centrales

Imprimido por:	Invitado
Día:	domingo, 26 de abril de 2026, 09:49

Hijos	\(f\)
0	2
1	3
2	4
3	1

Datos , tablas , medidas centrales

Tabla de contenidos

1. Media aritmética en datos sueltos [cálculo, interpretación, limitaciones] (PAES M1)

Media aritmética en datos sueltos [cálculo, interpretación, limitaciones] (PAES M1)

Ejemplo 1: cálculo directo de la media

Ejemplo 2: la media no siempre coincide con un dato

Ejemplo 3: lectura de tabla y cálculo de media

Ejemplo 4: limitación de la media ante un valor extremo

Ejercicios de práctica

Ejercicios tipo PAES

2. Mediana y moda en datos sueltos [comparación entre medidas centrales] (PAES M1)

Mediana y moda en datos sueltos [comparación entre medidas centrales] (PAES M1)

Ejemplo 1: mediana con cantidad impar de datos

Ejemplo 2: mediana con cantidad par de datos

Ejemplo 3: identificación de la moda

Ejemplo 4: conjunto bimodal

Ejemplo 5: lectura de tabla e interpretación

Ejercicios de práctica

Ejercicios tipo PAES

3. Tablas de frecuencia simple

Tablas de frecuencia simple [frecuencia absoluta (f), relativa , acumulada (F), relativa acumulada (H), en decimal, fracción y porcentaje] (PAES M1)

Ejemplo 1: construcción básica de una tabla de frecuencia

Ejemplo 2: frecuencia relativa como fracción, decimal y porcentaje

Ejemplo 3: frecuencia acumulada y relativa acumulada

Ejemplo 4: lectura directa desde una tabla

Ejercicios de práctica

Ejercicios tipo PAES

4. Media, moda y mediana en tablas simples de frecuencias (PAES M1)

Media, moda y mediana en tablas simples de frecuencias (PAES M1)

Ejemplo 1: calcular la moda desde una tabla

Ejemplo 2: calcular la media desde una tabla

Ejemplo 3: calcular la mediana con frecuencia acumulada

Ejemplo 4: mediana con cantidad par de datos

Ejemplo 5: comparación entre media, mediana y moda

Ejercicios de práctica

Ejercicios tipo PAES

5. tablas de datos agrupados por intervalos

Confección de tablas de datos agrupados por intervalos [marca de clase, \(f\), \(F\), \(h\), \(H\), intervalos aparentes e intervalos reales] (PAES M1)

Ejemplo 1: construcción de una tabla agrupada

Ejemplo 2: misma marca de clase usando intervalos aparentes o reales

Ejemplo 3: cálculo de marcas de clase

Ejemplo 4: lectura de una tabla agrupada

Ejercicios de práctica

Ejercicios tipo PAES

6. Media en datos agrupados

Media en datos agrupados [marca de clase, aproximación] (PAES M1)

Ejemplo 1: cálculo básico de la media agrupada

Ejemplo 2: por qué es una aproximación

Ejemplo 3: lectura de una tabla y cálculo completo

Ejemplo 4: comparación con datos no agrupados

Ejercicios de práctica

Ejercicios tipo PAES

7. Mediana en datos agrupados

Mediana en datos agrupados [intervalo mediano, cálculo e interpretación] (PAES M1)

Ejemplo 1: encontrar el intervalo mediano

Ejemplo 2: cálculo de la mediana agrupada

Ejemplo 3: interpretación de la mediana

Ejemplo 4: otro cálculo completo

Ejercicios de práctica

Ejercicios tipo PAES

8. Moda en datos agrupados

Moda en datos agrupados [clase modal, fórmula, estimación] (PAES M1)

Ejemplo 1: identificar la clase modal

Ejemplo 2: cálculo de la moda agrupada

Ejemplo 3: interpretación de la moda agrupada

Ejemplo 4: otro cálculo completo

Ejemplo 5: comparación entre clase modal y moda estimada

Ejercicios de práctica

Ejercicios tipo PAES

9. Comparación entre medidas centrales [datos sueltos vs agrupados, pérdida de información]

Comparación entre medidas centrales [datos sueltos vs agrupados, pérdida de información] (PAES M1)

Ejemplo guiado: misma información, distinto nivel de resumen

Ejercicio 1: desde datos sueltos a tabla de frecuencias simple

Ejercicio 2: agrupar los mismos datos y comparar las medidas

Ejercicio 3: segundo caso de datos agrupados

Cierre y reflexión

10. Sesgo y valores extremos [cuándo la media representa bien y cuándo no] (PAES M1)

Sesgo y valores extremos [cuándo la media representa bien y cuándo no] (PAES M1)

Ejemplo 1: conjunto equilibrado

Ejemplo 2: efecto de un valor extremo alto