Medidas de posición
| Sitio: | MATEMÁTICAS × Profe Arauco |
| Curso: | Probabilidades y Estadística Descriptiva e Inferencial |
| Libro: | Medidas de posición |
| Imprimido por: | Invitado |
| Día: | domingo, 26 de abril de 2026, 09:49 |
Tabla de contenidos
- 1. Rango y primera idea de variabilidad [amplitud total]
- 2. Cuartiles [Q1, Q2, Q3, interpretación]
- 3. Deciles [ubicación porcentual, lectura contextual]
- 4. Percentiles [uso en resultados estandarizados]
- 5. Relación entre cuartiles, deciles y percentiles [comparación conceptual]
- 6. Resumen de cinco números [mínimo, \(Q_1\), mediana, \(Q_3\), máximo]
- 7. Boxplot I [construcción paso a paso]
- 8. Boxplot II [interpretación, asimetría, dispersión, posibles atípicos]
- 9. Comparación de conjuntos de datos con boxplot [decisiones y conclusiones] (PAES M1)
- 10. Taller integrador de posición y boxplot
1. Rango y primera idea de variabilidad [amplitud total]
Objetivo
Comprender el rango o amplitud total como una primera medida de dispersión, calcularlo correctamente e interpretarlo para comparar qué tan extendidos o concentrados están distintos conjuntos de datos.
Ya aprendimos a organizar datos en tablas, representarlos con gráficos y calcular medidas de tendencia central como la media, la mediana y la moda.
Ahora aparece una pregunta nueva: aunque dos grupos tengan un centro parecido, ¿están igual de dispersos?
Para comenzar a responder esa idea, estudiaremos una medida muy simple: el rango.
El rango mide la distancia entre el valor mayor y el valor menor de un conjunto de datos.
\[ \text{Rango}=\text{valor máximo}-\text{valor mínimo} \]
Esta medida entrega una primera idea de variabilidad: mientras mayor sea el rango, más separados están, en general, los datos extremos.
- Identifica el dato menor.
- Identifica el dato mayor.
- Resta: máximo menos mínimo.
- Interpreta el resultado en contexto.
No es necesario sumar todos los datos ni calcular promedios para obtener el rango.
No confundas el rango con:
- la cantidad de datos,
- el dato mayor por sí solo,
- la diferencia entre datos consecutivos.
El rango siempre se calcula así:
\[ \text{máximo}-\text{mínimo} \]
Ejemplo 1: mismo centro, distinta variabilidad
Considera los siguientes dos grupos:
| Grupo | Datos |
|---|---|
| A | \(4,\ 5,\ 5,\ 5,\ 6\) |
| B | \(1,\ 5,\ 5,\ 5,\ 9\) |
En ambos grupos, la media es \(5\) y la mediana también es \(5\).
Sin embargo, observemos el rango:
Grupo A:
\[ \text{mínimo}=4,\qquad \text{máximo}=6 \]
\[ \text{Rango}=6-4=2 \]
Grupo B:
\[ \text{mínimo}=1,\qquad \text{máximo}=9 \]
\[ \text{Rango}=9-1=8 \]
Aunque ambos grupos tienen el mismo centro, el Grupo B presenta mayor variabilidad, porque sus datos extremos están mucho más separados.
Para comparar rápidamente la amplitud total de ambos grupos, representamos sus rangos en un gráfico de barras.
El gráfico confirma que el rango del Grupo B es mucho mayor que el del Grupo A.
Ejemplo 2: rango en contexto
Las temperaturas máximas registradas durante cinco días fueron:
\[ 18,\ 22,\ 21,\ 20,\ 25 \]
Buscamos el valor menor y el valor mayor:
\[ \text{mínimo}=18,\qquad \text{máximo}=25 \]
Entonces:
\[ \text{Rango}=25-18=7 \]
Interpretación: entre la temperatura más baja y la más alta hubo una diferencia de \(7\) grados.
Ejemplo 3: el rango no cuenta toda la historia
Observa estos dos conjuntos:
| Conjunto | Datos |
|---|---|
| C | \(2,\ 4,\ 4,\ 4,\ 6\) |
| D | \(2,\ 2,\ 4,\ 6,\ 6\) |
En ambos casos:
\[ \text{mínimo}=2,\qquad \text{máximo}=6,\qquad \text{rango}=6-2=4 \]
Los dos conjuntos tienen el mismo rango, pero no están distribuidos exactamente de la misma manera.
Esto muestra que el rango es una medida útil como primera aproximación, pero no describe por completo el comportamiento de todos los datos.
El rango permite una lectura inicial de la dispersión:
- si el rango es pequeño, los extremos están relativamente cerca;
- si el rango es grande, los extremos están más separados.
Por eso sirve como una primera idea de variabilidad, especialmente cuando recién comenzamos a comparar conjuntos de datos.
El rango solo utiliza dos datos: el menor y el mayor.
Por eso, si aparece un valor extremo muy alejado, el rango puede cambiar mucho, aunque la mayoría de los datos siga parecida.
Más adelante veremos medidas que describen la dispersión con mayor detalle.
Ejercicio 1
Calcula el rango del siguiente conjunto de datos:
\[ 7,\ 10,\ 8,\ 12,\ 9,\ 11 \]
Primero identificamos los extremos:
\[ \text{mínimo}=7,\qquad \text{máximo}=12 \]
Entonces:
\[ \text{Rango}=12-7=5 \]
Respuesta: el rango es \(5\).
Ejercicio 2
Dos cursos obtuvieron los siguientes puntajes en una actividad:
| Curso | Puntajes |
|---|---|
| 1°A | \(5,\ 6,\ 6,\ 6,\ 7\) |
| 1°B | \(2,\ 6,\ 6,\ 6,\ 10\) |
a) Calcula el rango de cada curso.
b) Indica cuál presenta mayor variabilidad según el rango.
Curso 1°A:
\[ \text{mínimo}=5,\qquad \text{máximo}=7 \]
\[ \text{Rango}=7-5=2 \]
Curso 1°B:
\[ \text{mínimo}=2,\qquad \text{máximo}=10 \]
\[ \text{Rango}=10-2=8 \]
Como \(8>2\), el curso 1°B presenta mayor variabilidad según el rango.
Conclusión: los puntajes de 1°B están más extendidos entre su valor mínimo y su valor máximo.
Ejercicio 3
Las cantidades de minutos que un grupo de estudiantes tardó en resolver una tarea fueron:
\[ 14,\ 16,\ 18,\ 17,\ 15,\ 19 \]
Calcula el rango e interpreta su significado en el contexto del problema.
Identificamos los extremos:
\[ \text{mínimo}=14,\qquad \text{máximo}=19 \]
Luego calculamos:
\[ \text{Rango}=19-14=5 \]
Interpretación: entre el estudiante que tardó menos y el que tardó más hubo una diferencia de \(5\) minutos.
Ejercicio 4
Decide si cada afirmación es verdadera o falsa. Justifica brevemente.
- Si un conjunto tiene rango \(0\), entonces todos sus datos son iguales.
- Para calcular el rango, se suman todos los datos y se divide por la cantidad de datos.
- Un conjunto con mayor rango siempre tiene una media mayor.
1. Verdadera.
Si el rango es \(0\), entonces:
\[ \text{máximo}-\text{mínimo}=0 \]
Eso solo ocurre cuando el máximo y el mínimo coinciden, es decir, cuando todos los datos son iguales.
2. Falsa.
Esa descripción corresponde a la media aritmética. El rango se obtiene restando:
\[ \text{máximo}-\text{mínimo} \]
3. Falsa.
El rango informa sobre la dispersión de los extremos, no sobre el valor promedio. Un conjunto puede tener rango mayor y, aun así, tener la misma media o incluso una media menor.
Ejercicio 5
Observa estos dos conjuntos:
\[ A=\{4,4,5,5,6\} \]
\[ B=\{4,4,5,5,20\} \]
a) Calcula el rango de cada conjunto.
b) Explica qué efecto produce el valor \(20\) en el conjunto \(B\).
Conjunto A:
\[ \text{mínimo}=4,\qquad \text{máximo}=6 \]
\[ \text{Rango}=6-4=2 \]
Conjunto B:
\[ \text{mínimo}=4,\qquad \text{máximo}=20 \]
\[ \text{Rango}=20-4=16 \]
El valor \(20\) actúa como un dato extremo que aumenta mucho el rango.
Conclusión: aunque varios datos de ambos conjuntos son parecidos, en \(B\) aparece un valor muy alejado que hace crecer considerablemente la amplitud total.
Ticket de salida
- ¿Qué mide el rango?
- ¿Cómo se calcula?
- Si dos conjuntos tienen la misma media, ¿pueden tener distinto rango?
- El rango mide la distancia entre el dato mayor y el dato menor de un conjunto.
- Se calcula restando: \[ \text{máximo}-\text{mínimo} \]
- Sí. Dos conjuntos pueden tener la misma media y, sin embargo, distinta variabilidad. El rango ayuda a detectar esa diferencia inicial.
- El rango también se llama amplitud total.
- Se calcula como máximo menos mínimo.
- Entrega una primera idea de dispersión.
- Un rango mayor suele indicar mayor separación entre los datos extremos.
- El rango es útil, pero no describe por completo cómo se distribuyen todos los datos.
2. Cuartiles [Q1, Q2, Q3, interpretación]
Objetivo de la página
Comprender qué son los cuartiles, calcular \(Q_1\), \(Q_2\) y \(Q_3\) en datos ordenados e interpretar su significado en contexto, usando una convención consistente con la lectura porcentual de los percentiles.
Conexión con lo ya trabajado
En la página anterior vimos que el rango entrega una primera idea de variabilidad usando solo el dato menor y el dato mayor.
Ahora avanzaremos hacia otra pregunta importante: ¿cómo se ubican los datos dentro del conjunto?
Los cuartiles permiten responder esa pregunta, porque dividen los datos ordenados en cuatro partes y ayudan a describir la posición relativa de los valores.
Qué son los cuartiles
Los cuartiles son medidas de posición que dividen un conjunto de datos ordenados en cuatro partes.
Los principales son:
- \(Q_1\): primer cuartil
- \(Q_2\): segundo cuartil o mediana
- \(Q_3\): tercer cuartil
Su interpretación básica es:
- aproximadamente el 25\% de los datos queda en o bajo \(Q_1\),
- aproximadamente el 50\% de los datos queda en o bajo \(Q_2\),
- aproximadamente el 75\% de los datos queda en o bajo \(Q_3\).
Convención que usaremos en esta página
Para mantener una sola lógica de trabajo, tomaremos los cuartiles como percentiles especiales:
\[ Q_1=P_{25},\qquad Q_2=P_{50},\qquad Q_3=P_{75} \]
Por eso calcularemos sus posiciones con:
\[ \text{Posición}=\frac{k}{100}(n+1) \]
Si la posición es entera, el cuartil coincide con ese dato ordenado.
Si la posición no es entera, en esta página usaremos el criterio escolar de promediar los dos datos vecinos.
Procedimiento que usaremos
- Ordena los datos de menor a mayor.
- Calcula la posición de \(Q_1\), \(Q_2\) y \(Q_3\) usando: \[ \frac{25}{100}(n+1),\qquad \frac{50}{100}(n+1),\qquad \frac{75}{100}(n+1) \]
- Si una posición es entera, toma ese dato.
- Si una posición es decimal, promedia los dos datos ordenados más cercanos.
- Interpreta el resultado en contexto.
Error frecuente
Los cuartiles no se calculan sobre datos desordenados.
Antes de buscar \(Q_1\), \(Q_2\) y \(Q_3\), siempre hay que ordenar el conjunto de menor a mayor.
Ejemplo 1: cálculo de cuartiles con cantidad impar de datos
Considera el conjunto:
\[ 8,\ 3,\ 10,\ 7,\ 4,\ 12,\ 2,\ 6,\ 9 \]
Paso 1: ordenar los datos
\[ 2,\ 3,\ 4,\ 6,\ 7,\ 8,\ 9,\ 10,\ 12 \]
Hay \(n=9\) datos, por lo tanto:
\[ n+1=10 \]
Cálculo de \(Q_1=P_{25}\)
\[ \frac{25}{100}(10)=2{,}5 \]
La posición no es entera, así que promediamos el segundo y el tercer dato:
\[ Q_1=\frac{3+4}{2}=3{,}5 \]
Cálculo de \(Q_2=P_{50}\)
\[ \frac{50}{100}(10)=5 \]
La posición es entera, así que tomamos el quinto dato:
\[ Q_2=7 \]
Cálculo de \(Q_3=P_{75}\)
\[ \frac{75}{100}(10)=7{,}5 \]
La posición no es entera, así que promediamos el séptimo y el octavo dato:
\[ Q_3=\frac{9+10}{2}=9{,}5 \]
Resultado final:
\[ Q_1=3{,}5,\qquad Q_2=7,\qquad Q_3=9{,}5 \]
Ejemplo 2: cálculo de cuartiles con cantidad par de datos
Considera ahora:
\[ 11,\ 6,\ 4,\ 8,\ 10,\ 7,\ 13,\ 5,\ 9,\ 6 \]
Paso 1: ordenar
\[ 4,\ 5,\ 6,\ 6,\ 7,\ 8,\ 9,\ 10,\ 11,\ 13 \]
Hay \(n=10\) datos, por lo tanto:
\[ n+1=11 \]
Cálculo de \(Q_1=P_{25}\)
\[ \frac{25}{100}(11)=2{,}75 \]
La posición no es entera, así que promediamos el segundo y el tercer dato:
\[ Q_1=\frac{5+6}{2}=5{,}5 \]
Cálculo de \(Q_2=P_{50}\)
\[ \frac{50}{100}(11)=5{,}5 \]
La posición no es entera, así que promediamos el quinto y el sexto dato:
\[ Q_2=\frac{7+8}{2}=7{,}5 \]
Cálculo de \(Q_3=P_{75}\)
\[ \frac{75}{100}(11)=8{,}25 \]
La posición no es entera, así que promediamos el octavo y el noveno dato:
\[ Q_3=\frac{10+11}{2}=10{,}5 \]
Resultado final:
\[ Q_1=5{,}5,\qquad Q_2=7{,}5,\qquad Q_3=10{,}5 \]
Ejemplo 3: apoyo visual con ojiva simplificada
Como ya trabajamos la frecuencia acumulada, también podemos interpretar cuartiles con una ojiva.
Para simplificar la lectura, usaremos una ojiva cuya frecuencia acumulada total es 100. Así, los cuartiles se leen directamente en los niveles acumulados:
\[ 25,\qquad 50,\qquad 75 \]
| Intervalo | Frecuencia | Frecuencia acumulada |
|---|---|---|
| \([350,400)\) | 15 | 15 |
| \([400,450)\) | 20 | 35 |
| \([450,500)\) | 15 | 50 |
| \([500,550)\) | 25 | 75 |
| \([550,600]\) | 25 | 100 |
Lectura de \(Q_1\)
\(Q_1\) corresponde al 25\% acumulado. En la ojiva, ese valor queda entre \(15\) y \(35\), por lo que \(Q_1\) se ubica dentro del intervalo \([400,450)\).
Una lectura aproximada lo sitúa cerca de:
\[ Q_1\approx 425 \]
Lectura de \(Q_2\)
\(Q_2\) corresponde al 50\% acumulado. En este caso, la ojiva pasa exactamente por:
\[ Q_2=500 \]
Lectura de \(Q_3\)
\(Q_3\) corresponde al 75\% acumulado. En la ojiva, ese valor se alcanza en:
\[ Q_3=550 \]
Desde esta ojiva sí podemos afirmar, por ejemplo, que aproximadamente el 50\% de los puntajes está en o bajo \(500\).
Pero no podemos afirmar, solo mirando la ojiva, cuáles son todos los puntajes exactos ni cuántas veces se repite cada valor individual.
Ejemplo 4: interpretación en contexto
En una evaluación, los puntajes ordenados de un grupo de estudiantes fueron:
\[ 420,\ 450,\ 470,\ 500,\ 520,\ 540,\ 580,\ 610,\ 650 \]
Como hay \(9\) datos, entonces:
\[ n+1=10 \]
Cálculo de \(Q_1=P_{25}\)
\[ \frac{25}{100}(10)=2{,}5 \]
\[ Q_1=\frac{450+470}{2}=460 \]
Cálculo de \(Q_2=P_{50}\)
\[ \frac{50}{100}(10)=5 \]
\[ Q_2=520 \]
Cálculo de \(Q_3=P_{75}\)
\[ \frac{75}{100}(10)=7{,}5 \]
\[ Q_3=\frac{580+610}{2}=595 \]
Interpretación:
- Aproximadamente el \(25\%\) de los puntajes está en o bajo \(460\).
- Aproximadamente el \(50\%\) de los puntajes está en o bajo \(520\).
- Aproximadamente el \(75\%\) de los puntajes está en o bajo \(595\).
Lectura más cuidadosa: decir que un estudiante obtuvo un puntaje mayor que \(Q_3\) significa que se ubica en el tramo superior del grupo, pero no permite concluir por sí solo cuánto mejor fue su rendimiento respecto del resto.
El segundo cuartil \(Q_2\) coincide con la mediana.
Por eso, estudiar cuartiles amplía una idea que ya conocíamos: no solo interesa el centro, sino también cómo se distribuyen las posiciones a ambos lados del centro.
| Medida | Nombre | Interpretación básica |
|---|---|---|
| \(Q_1\) | Primer cuartil | Aproximadamente el 25% de los datos queda en o bajo ese valor |
| \(Q_2\) | Segundo cuartil | Corresponde a la mediana; aproximadamente el 50% de los datos queda en o bajo ese valor |
| \(Q_3\) | Tercer cuartil | Aproximadamente el 75% de los datos queda en o bajo ese valor |
Ejercicio 1
Calcula \(Q_1\), \(Q_2\) y \(Q_3\) del conjunto:
\[ 5,\ 7,\ 9,\ 3,\ 8,\ 10,\ 6 \]
Primero ordenamos:
\[ 3,\ 5,\ 6,\ 7,\ 8,\ 9,\ 10 \]
Hay \(n=7\) datos, entonces:
\[ n+1=8 \]
\(Q_1=P_{25}\)
\[ \frac{25}{100}(8)=2 \]
\[ Q_1=5 \]
\(Q_2=P_{50}\)
\[ \frac{50}{100}(8)=4 \]
\[ Q_2=7 \]
\(Q_3=P_{75}\)
\[ \frac{75}{100}(8)=6 \]
\[ Q_3=9 \]
Respuesta:
\[ Q_1=5,\qquad Q_2=7,\qquad Q_3=9 \]
Ejercicio 2
Calcula los cuartiles del conjunto ordenado:
\[ 2,\ 4,\ 5,\ 7,\ 8,\ 9,\ 11,\ 13 \]
Hay \(n=8\) datos, entonces:
\[ n+1=9 \]
\(Q_1=P_{25}\)
\[ \frac{25}{100}(9)=2{,}25 \]
Promediamos el segundo y el tercer dato:
\[ Q_1=\frac{4+5}{2}=4{,}5 \]
\(Q_2=P_{50}\)
\[ \frac{50}{100}(9)=4{,}5 \]
Promediamos el cuarto y el quinto dato:
\[ Q_2=\frac{7+8}{2}=7{,}5 \]
\(Q_3=P_{75}\)
\[ \frac{75}{100}(9)=6{,}75 \]
Promediamos el sexto y el séptimo dato:
\[ Q_3=\frac{9+11}{2}=10 \]
Respuesta:
\[ Q_1=4{,}5,\qquad Q_2=7{,}5,\qquad Q_3=10 \]
Ejercicio 3
Los tiempos, en minutos, que tardó un grupo en resolver una actividad fueron:
\[ 12,\ 14,\ 15,\ 16,\ 18,\ 20,\ 22,\ 24,\ 27 \]
a) Calcula \(Q_1\), \(Q_2\) y \(Q_3\).
b) Interpreta \(Q_2\) en el contexto del problema.
c) Explica qué información adicional entrega \(Q_1\) respecto de la sola mediana.
Los datos ya están ordenados.
Hay \(n=9\) datos, entonces:
\[ n+1=10 \]
\(Q_1=P_{25}\)
\[ \frac{25}{100}(10)=2{,}5 \]
\[ Q_1=\frac{14+15}{2}=14{,}5 \]
\(Q_2=P_{50}\)
\[ \frac{50}{100}(10)=5 \]
\[ Q_2=18 \]
\(Q_3=P_{75}\)
\[ \frac{75}{100}(10)=7{,}5 \]
\[ Q_3=\frac{22+24}{2}=23 \]
Interpretación de \(Q_2\): aproximadamente la mitad del grupo tardó 18 minutos o menos, y la otra mitad tardó 18 minutos o más.
Información adicional de \(Q_1\): permite ubicar el tramo inferior del conjunto, indicando que aproximadamente el 25\% del grupo tardó 14,5 minutos o menos. Es decir, entrega información sobre una parte del grupo que la mediana por sí sola no describe.
Ejercicio 4
Decide si cada afirmación es verdadera o falsa. Justifica.
- \(Q_2\) coincide con la mediana.
- Para calcular cuartiles, no importa si los datos están ordenados o no.
- \(Q_3\) deja aproximadamente al \(75\%\) de los datos en o bajo ese valor.
- Si un estudiante quedó sobre \(Q_3\), entonces necesariamente obtuvo el puntaje máximo del grupo.
1. Verdadera.
El segundo cuartil \(Q_2\) corresponde a la mediana del conjunto.
2. Falsa.
Los cuartiles son medidas de posición, por lo tanto deben calcularse sobre los datos ordenados.
3. Verdadera.
El tercer cuartil \(Q_3\) indica un valor bajo el cual se encuentra aproximadamente el \(75\%\) de los datos.
4. Falsa.
Estar sobre \(Q_3\) significa ubicarse en el tramo superior del grupo, pero no implica necesariamente tener el puntaje máximo.
Ejercicio 5
En una ojiva con frecuencia acumulada total \(100\), se observa que el nivel acumulado \(25\) se alcanza cerca de \(430\), el nivel \(50\) en \(500\) y el nivel \(75\) en \(560\).
a) Estima \(Q_1\), \(Q_2\) y \(Q_3\).
b) Explica qué significa que un resultado quede sobre \(Q_3\).
c) Indica una afirmación que sí puede concluirse desde esa ojiva y una que no puede concluirse directamente.
a) Estimación de cuartiles:
\[ Q_1\approx 430,\qquad Q_2\approx 500,\qquad Q_3\approx 560 \]
b) Significado de quedar sobre \(Q_3\): significa ubicarse por encima del valor que deja aproximadamente al 75\% de los datos en o bajo él. Es decir, el resultado queda en el tramo superior del grupo.
c) Una afirmación que sí puede concluirse: aproximadamente el 50\% de los datos queda en o bajo \(500\).
Una afirmación que no puede concluirse directamente: no puede afirmarse cuál es la media exacta del grupo ni cuáles son todos los valores individuales.
Ticket de salida
- ¿Qué representa \(Q_2\)?
- ¿Qué porcentaje aproximado de datos queda en o bajo \(Q_1\)?
- Escribe una conclusión breve y bien justificada usando \(Q_3\).
- \(Q_2\) representa la mediana del conjunto.
- En o bajo \(Q_1\) queda aproximadamente el 25\% de los datos.
- Una posible respuesta es: “Si un estudiante obtuvo un puntaje mayor que \(Q_3\), entonces se ubica en el tramo superior del grupo, por encima del valor que deja aproximadamente al 75\% de los datos en o bajo él”.
- Los cuartiles se calculan sobre datos ordenados.
- \(Q_2\) coincide con la mediana.
- \(Q_1\), \(Q_2\) y \(Q_3\) ayudan a describir la posición relativa de los datos.
- \(Q_1\), \(Q_2\) y \(Q_3\) se interpretan aproximadamente con los porcentajes \(25\%\), \(50\%\) y \(75\%\).
- La ojiva puede servir como apoyo visual para leer cuartiles, pero no reemplaza por completo el análisis del contexto ni describe todos los datos individuales.
3. Deciles [ubicación porcentual, lectura contextual]
Objetivo de la página
Comprender qué son los deciles, calcular su ubicación en un conjunto de datos ordenados e interpretar su significado como medidas de posición porcentual en distintos contextos.
En la página anterior vimos que los cuartiles dividen un conjunto ordenado en cuatro partes.
Ahora avanzaremos a una división más fina: los deciles dividen los datos ordenados en diez partes.
Esto permite describir con más detalle la posición relativa de un valor dentro del conjunto.
Los deciles son medidas de posición que dividen un conjunto de datos ordenados en diez partes.
Se nombran como \(D_1, D_2, D_3, \dots, D_9\).
Su interpretación básica es:
- \(D_1\): deja aproximadamente el 10\% de los datos en o bajo ese valor.
- \(D_2\): deja aproximadamente el 20\% de los datos en o bajo ese valor.
- \(D_5\): deja aproximadamente el 50\% de los datos en o bajo ese valor.
- \(D_9\): deja aproximadamente el 90\% de los datos en o bajo ese valor.
Por eso, los deciles permiten ubicar un valor según su posición porcentual dentro del conjunto.
- Ordena los datos de menor a mayor.
- Elige el decil que quieres calcular.
- Calcula su posición con la fórmula: \[ P_{D_k}=\frac{k(n+1)}{10} \] donde \(k\) es el número del decil y \(n\) es la cantidad de datos.
- Si la posición es entera, el decil coincide con ese dato ordenado.
- Si la posición no es entera, el decil queda entre dos datos consecutivos y se interpola linealmente.
- Los deciles solo tienen sentido cuando los datos están ordenados.
- No hay que confundir \(D_5\) con “el quinto dato”. \(D_5\) significa quinto decil, es decir, el valor que deja aproximadamente al 50\% de los datos en o bajo él.
Ejemplo 1: cálculo de deciles con posición entera
Considera los siguientes puntajes, ya ordenados:
\[ 40,\ 45,\ 50,\ 55,\ 60,\ 62,\ 64,\ 66,\ 68,\ 70,\ 72,\ 74,\ 76,\ 78,\ 80,\ 82,\ 84,\ 86,\ 90 \]
Hay \(n=19\) datos. Entonces:
\[ n+1=20 \]
Cálculo de \(D_2\)
\[ P_{D_2}=\frac{2(20)}{10}=4 \]
El cuarto dato es \(55\), por lo tanto:
\[ D_2=55 \]
Cálculo de \(D_5\)
\[ P_{D_5}=\frac{5(20)}{10}=10 \]
El décimo dato es \(70\), por lo tanto:
\[ D_5=70 \]
Cálculo de \(D_8\)
\[ P_{D_8}=\frac{8(20)}{10}=16 \]
El dato número \(16\) es \(82\), por lo tanto:
\[ D_8=82 \]
Interpretación:
- \(D_2=55\) deja aproximadamente al \(20\%\) de los puntajes en o bajo \(55\).
- \(D_5=70\) deja aproximadamente al \(50\%\) de los puntajes en o bajo \(70\).
- \(D_8=82\) deja aproximadamente al \(80\%\) de los puntajes en o bajo \(82\).
Ejemplo 2: cálculo de un decil con posición decimal
Considera el conjunto ordenado:
\[ 5,\ 8,\ 10,\ 12,\ 15,\ 18,\ 20,\ 24,\ 27,\ 30 \]
Hay \(n=10\) datos. Calcularemos \(D_3\).
\[ P_{D_3}=\frac{3(10+1)}{10}=\frac{33}{10}=3{,}3 \]
La posición \(3{,}3\) está entre el tercer y el cuarto dato:
\[ x_3=10,\qquad x_4=12 \]
Eso significa que \(D_3\) está un \(0{,}3\) del camino entre \(10\) y \(12\).
La diferencia entre ambos valores es:
\[ 12-10=2 \]
Entonces:
\[ D_3=10+0{,}3\cdot 2=10+0{,}6=10{,}6 \]
Resultado:
\[ D_3=10{,}6 \]
Interpretación: aproximadamente el 30\% de los datos queda en o bajo \(10{,}6\).
Ejemplo 3: apoyo visual con ojiva y frecuencia acumulada 4000
Como ya trabajamos la frecuencia acumulada, también podemos interpretar deciles con una ojiva.
Esta vez usaremos una frecuencia acumulada total de 4000. Así, cada decil se lee buscando el acumulado correspondiente:
\[ D_1\rightarrow 400,\quad D_3\rightarrow 1200,\quad D_5\rightarrow 2000,\quad D_7\rightarrow 2800,\quad D_9\rightarrow 3600 \]
| Intervalo | Frecuencia | Frecuencia acumulada |
|---|---|---|
| \([300,400)\) | 400 | 400 |
| \([400,500)\) | 800 | 1200 |
| \([500,600)\) | 1200 | 2400 |
| \([600,700)\) | 800 | 3200 |
| \([700,800]\) | 800 | 4000 |
Lectura de \(D_3\)
Buscamos el acumulado correspondiente al \(30\%\) de \(4000\):
\[ 0{,}30\cdot 4000=1200 \]
En la ojiva, el acumulado \(1200\) se alcanza en:
\[ D_3=500 \]
Lectura aproximada de \(D_7\)
Buscamos el acumulado correspondiente al \(70\%\) de \(4000\):
\[ 0{,}70\cdot 4000=2800 \]
Ese valor cae entre \(2400\) y \(3200\), por lo que se ubica dentro del tramo \([600,700)\).
Como \(2800\) está justo a la mitad entre \(2400\) y \(3200\), una estimación razonable es:
\[ D_7\approx 650 \]
Lectura aproximada de \(D_9\)
Buscamos el acumulado correspondiente al \(90\%\) de \(4000\):
\[ 0{,}90\cdot 4000=3600 \]
Ese valor cae entre \(3200\) y \(4000\), dentro del tramo \([700,800]\).
Como también queda a la mitad de ese tramo acumulado, una estimación razonable es:
\[ D_9\approx 750 \]
Desde esta ojiva sí podemos estimar qué valor deja acumulado un cierto porcentaje del total.
Pero no podemos concluir, solo con la ojiva, cuáles son todos los puntajes individuales ni cuántas veces se repite exactamente cada valor.
Ejemplo 4: lectura contextual de un decil
Los tiempos, en minutos, de un grupo ordenado de participantes fueron:
\[ 12,\ 14,\ 15,\ 16,\ 17,\ 18,\ 19,\ 20,\ 21,\ 22,\ 23,\ 24,\ 26,\ 28,\ 30,\ 32,\ 34,\ 36,\ 38 \]
Hay \(19\) datos, por lo que:
\[ n+1=20 \]
Calculemos \(D_7\):
\[ P_{D_7}=\frac{7(20)}{10}=14 \]
El dato número \(14\) es \(28\). Entonces:
\[ D_7=28 \]
Interpretación contextual: aproximadamente el 70\% del grupo tardó \(28\) minutos o menos, y aproximadamente el 30\% tardó más de \(28\) minutos.
Lectura más cuidadosa: decir que una persona quedó sobre \(D_7\) no significa que “rindió exactamente 70\%”, sino que se ubica por encima del valor que deja aproximadamente al 70\% del grupo en o bajo él.
| Decil | Porcentaje aproximado | Lectura |
|---|---|---|
| \(D_1\) | 10% | Deja aproximadamente al 10% de los datos en o bajo ese valor |
| \(D_3\) | 30% | Deja aproximadamente al 30% de los datos en o bajo ese valor |
| \(D_5\) | 50% | Deja aproximadamente al 50% de los datos en o bajo ese valor |
| \(D_7\) | 70% | Deja aproximadamente al 70% de los datos en o bajo ese valor |
| \(D_9\) | 90% | Deja aproximadamente al 90% de los datos en o bajo ese valor |
El decil \(D_5\) se asocia con el 50\% de los datos, por lo que se relaciona directamente con la idea de mediana.
Así como \(Q_2\) coincide con la mediana, \(D_5\) también representa una posición central del conjunto.
Ejercicio 1
Los siguientes datos están ordenados:
\[ 6,\ 8,\ 10,\ 12,\ 14,\ 16,\ 18,\ 20,\ 22,\ 24,\ 26,\ 28,\ 30,\ 32,\ 34,\ 36,\ 38,\ 40,\ 42 \]
Calcula \(D_2\) y \(D_8\).
Hay \(19\) datos, entonces:
\[ n+1=20 \]
Para \(D_2\):
\[ P_{D_2}=\frac{2(20)}{10}=4 \]
El cuarto dato es \(12\). Por lo tanto:
\[ D_2=12 \]
Para \(D_8\):
\[ P_{D_8}=\frac{8(20)}{10}=16 \]
El dato número \(16\) es \(36\). Por lo tanto:
\[ D_8=36 \]
Ejercicio 2
Calcula \(D_4\) del conjunto ordenado:
\[ 3,\ 5,\ 7,\ 9,\ 11,\ 13,\ 15,\ 17,\ 19,\ 21 \]
Hay \(n=10\) datos.
\[ P_{D_4}=\frac{4(10+1)}{10}=\frac{44}{10}=4{,}4 \]
La posición \(4{,}4\) está entre el cuarto y el quinto dato:
\[ x_4=9,\qquad x_5=11 \]
La diferencia es:
\[ 11-9=2 \]
Entonces:
\[ D_4=9+0{,}4\cdot 2=9+0{,}8=9{,}8 \]
Respuesta:
\[ D_4=9{,}8 \]
Ejercicio 3
Los siguientes puntajes ordenados corresponden a un grupo de estudiantes:
\[ 410,\ 430,\ 450,\ 470,\ 490,\ 510,\ 530,\ 550,\ 570,\ 590,\ 610,\ 630,\ 650,\ 670,\ 690,\ 710,\ 730,\ 750,\ 770 \]
a) Calcula \(D_7\).
b) Interpreta su significado en el contexto del problema.
c) Explica qué no puede concluirse solo con saber el valor de \(D_7\).
Hay \(19\) datos, por lo tanto:
\[ n+1=20 \]
\[ P_{D_7}=\frac{7(20)}{10}=14 \]
El dato número \(14\) es \(670\). Entonces:
\[ D_7=670 \]
Interpretación: aproximadamente el 70\% de los estudiantes obtuvo un puntaje igual o inferior a \(670\), y aproximadamente el 30\% obtuvo un puntaje mayor.
Lo que no puede concluirse solo con \(D_7\): no se puede saber la media exacta del grupo, ni todos los puntajes individuales, ni cuánto se separan entre sí los datos por encima o por debajo de \(670\).
Ejercicio 4
Decide si cada afirmación es verdadera o falsa. Justifica.
- \(D_5\) se relaciona con el 50% de los datos.
- \(D_9\) deja aproximadamente al 90% de los datos en o bajo ese valor.
- Los deciles pueden calcularse sin ordenar los datos.
- Si una persona está sobre \(D_8\), entonces necesariamente tiene el valor máximo del conjunto.
1. Verdadera.
\(D_5\) se asocia al 50% de los datos, por lo que se relaciona con una posición central del conjunto.
2. Verdadera.
El noveno decil deja aproximadamente al 90% de los datos en o bajo ese valor.
3. Falsa.
Los deciles son medidas de posición, por lo tanto se calculan sobre datos ordenados.
4. Falsa.
Estar sobre \(D_8\) significa ubicarse en el tramo superior del conjunto, pero no implica necesariamente tener el valor máximo.
Ejercicio 5
En una ojiva con frecuencia acumulada total \(4000\), se observa que el nivel acumulado \(1600\) se alcanza cerca de \(540\) y el nivel acumulado \(3200\) cerca de \(700\).
a) Estima \(D_4\) y \(D_8\).
b) Interpreta \(D_8\).
c) Indica una afirmación que sí puede concluirse desde esa ojiva y una que no puede concluirse directamente.
a) Estimación:
Como:
\[ 0{,}40\cdot 4000=1600 \]
y
\[ 0{,}80\cdot 4000=3200 \]
entonces:
\[ D_4\approx 540,\qquad D_8\approx 700 \]
b) Interpretación de \(D_8\): aproximadamente el 80\% de los datos queda en o bajo \(700\).
c) Una afirmación que sí puede concluirse: el valor que deja acumulado el 80% del grupo se ubica aproximadamente en \(700\).
Una afirmación que no puede concluirse directamente: no puede afirmarse cuál es la media exacta del grupo ni cuáles son todos los valores individuales.
Ticket de salida
- ¿Qué porcentaje aproximado de los datos queda en o bajo \(D_3\)?
- ¿Qué representa \(D_5\)?
- Escribe una conclusión breve y bien justificada usando \(D_7\).
- En o bajo \(D_3\) queda aproximadamente el 30\% de los datos.
- \(D_5\) representa la posición que deja aproximadamente al 50\% de los datos en o bajo ese valor.
- Una posible respuesta es: “Si un resultado está por encima de \(D_7\), entonces se ubica por sobre el valor que deja aproximadamente al 70\% del grupo en o bajo él”.
- Los deciles dividen un conjunto ordenado en diez partes.
- \(D_k\) deja aproximadamente al \(10k\%\) de los datos en o bajo ese valor.
- \(D_5\) se relaciona con la posición central del conjunto.
- Los deciles ayudan a interpretar ubicación porcentual en contextos reales.
- La ojiva puede servir como apoyo visual para leer deciles, pero no reemplaza por completo el análisis del contexto ni describe todos los datos individuales.
4. Percentiles [uso en resultados estandarizados]
Objetivo de la página
Comprender qué son los percentiles, calcular su posición en datos ordenados e interpretar su significado en contextos como puntajes estandarizados, comparaciones de rendimiento y lectura de ubicación relativa.
En la página anterior vimos que los deciles dividen los datos ordenados en diez partes.
Ahora daremos un paso todavía más fino: los percentiles dividen el conjunto en 100 partes.
Por eso son especialmente útiles cuando interesa describir con mayor precisión la posición relativa de una persona o de un resultado dentro de un grupo.
Los percentiles son medidas de posición que dividen un conjunto de datos ordenados en 100 partes.
Se representan como \(P_1,\ P_2,\ P_3,\ \dots,\ P_{99}\).
Su interpretación básica es:
- \(P_{25}\): deja aproximadamente el 25\% de los datos en o bajo ese valor.
- \(P_{50}\): deja aproximadamente el 50\% de los datos en o bajo ese valor.
- \(P_{80}\): deja aproximadamente el 80\% de los datos en o bajo ese valor.
- \(P_{90}\): deja aproximadamente el 90\% de los datos en o bajo ese valor.
- Ordena los datos de menor a mayor.
- Elige el percentil que quieres calcular.
- Calcula su posición con la fórmula: \[ \text{Pos}(P_k)=\frac{k(n+1)}{100} \] donde \(k\) es el número del percentil y \(n\) es la cantidad de datos.
- Si la posición es entera, el percentil coincide con ese dato ordenado.
- Si la posición no es entera, el percentil queda entre dos datos consecutivos y se interpola linealmente.
Estar en el percentil \(85\) no significa obtener 85 puntos ni responder correctamente el 85\% de una prueba.
Significa que el resultado se ubica por sobre muchos otros, de modo que aproximadamente el 85\% del grupo queda en o bajo ese valor.
Ejemplo 1: cálculo de percentiles con posiciones enteras
Considera los siguientes puntajes, ya ordenados:
\[ 380,\ 400,\ 420,\ 440,\ 460,\ 480,\ 500,\ 520,\ 540,\ 560,\ 580,\ 600,\ 620,\ 640,\ 660,\ 680,\ 700,\ 720,\ 740 \]
Hay \(n=19\) datos. Entonces:
\[ n+1=20 \]
Cálculo de \(P_{25}\)
\[ \text{Pos}(P_{25})=\frac{25\cdot 20}{100}=5 \]
El quinto dato es \(460\), por lo tanto:
\[ P_{25}=460 \]
Cálculo de \(P_{50}\)
\[ \text{Pos}(P_{50})=\frac{50\cdot 20}{100}=10 \]
El décimo dato es \(560\), por lo tanto:
\[ P_{50}=560 \]
Cálculo de \(P_{75}\)
\[ \text{Pos}(P_{75})=\frac{75\cdot 20}{100}=15 \]
El dato número \(15\) es \(660\), por lo tanto:
\[ P_{75}=660 \]
Resultado:
\[ P_{25}=460,\qquad P_{50}=560,\qquad P_{75}=660 \]
Ejemplo 2: cálculo de un percentil con posición decimal
Considera el conjunto ordenado:
\[ 10,\ 12,\ 15,\ 18,\ 20,\ 22,\ 25,\ 27,\ 30,\ 34 \]
Calcularemos \(P_{30}\).
Como hay \(n=10\) datos:
\[ \text{Pos}(P_{30})=\frac{30(10+1)}{100}=\frac{330}{100}=3{,}3 \]
La posición \(3{,}3\) queda entre el tercer y el cuarto dato:
\[ x_3=15,\qquad x_4=18 \]
La diferencia entre ambos es:
\[ 18-15=3 \]
Entonces:
\[ P_{30}=15+0{,}3\cdot 3=15+0{,}9=15{,}9 \]
Resultado:
\[ P_{30}=15{,}9 \]
Interpretación: aproximadamente el 30\% de los datos queda en o bajo \(15{,}9\).
Ejemplo 3: interpretación en resultados estandarizados
Un informe señala que una estudiante quedó en el percentil 85 de un examen.
¿Qué significa?
Significa que su resultado es igual o superior al de gran parte del grupo, de modo que aproximadamente el 85\% de los puntajes queda en o bajo el suyo.
Equivalentemente, aproximadamente el 15\% del grupo obtuvo un resultado mayor.
No significa que haya obtenido exactamente \(85\) puntos ni que haya respondido bien el \(85\%\) de la prueba.
El percentil permite ubicar un resultado dentro del grupo, pero no describe por sí solo la dificultad de la prueba ni la distancia exacta entre un puntaje y otro.
Ejemplo 4: apoyo visual con ojiva y frecuencia acumulada 500
Como ya trabajamos la frecuencia acumulada, podemos usar una ojiva para interpretar percentiles de manera visual.
Esta vez usaremos una frecuencia acumulada total de 500. Así, los percentiles se leen buscando el acumulado correspondiente:
\[ P_{25}\rightarrow 125,\qquad P_{50}\rightarrow 250,\qquad P_{85}\rightarrow 425 \]
| Intervalo | Frecuencia | Frecuencia acumulada |
|---|---|---|
| \([300,400)\) | 50 | 50 |
| \([400,500)\) | 75 | 125 |
| \([500,600)\) | 125 | 250 |
| \([600,700)\) | 125 | 375 |
| \([700,800]\) | 125 | 500 |
Lectura de \(P_{25}\)
Buscamos el acumulado correspondiente al \(25\%\) de \(500\):
\[ 0{,}25\cdot 500=125 \]
En la ojiva, el acumulado \(125\) se alcanza en:
\[ P_{25}=500 \]
Lectura de \(P_{50}\)
Buscamos el acumulado correspondiente al \(50\%\) de \(500\):
\[ 0{,}50\cdot 500=250 \]
En la ojiva, el acumulado \(250\) se alcanza en:
\[ P_{50}=600 \]
Lectura aproximada de \(P_{85}\)
Buscamos el acumulado correspondiente al \(85\%\) de \(500\):
\[ 0{,}85\cdot 500=425 \]
Ese valor cae entre \(375\) y \(500\), por lo que se ubica dentro del tramo \([700,800]\).
Como \(425\) está \(50\) unidades sobre \(375\), y el tramo acumulado total es de \(125\), se ubica a:
\[ \frac{50}{125}=0{,}4 \]
del intervalo. Entonces una lectura aproximada es:
\[ P_{85}\approx 700+0{,}4\cdot 100=740 \]
Desde esta ojiva sí podemos estimar qué valor deja acumulado un cierto porcentaje del total.
Pero no podemos concluir, solo con la ojiva, cuáles son todos los puntajes individuales, cuál es la media exacta ni cuánto se separan exactamente unos datos de otros.
| Medida | Equivalencia | Interpretación |
|---|---|---|
| \(P_{25}\) | \(Q_1\) | Deja aproximadamente el 25% de los datos en o bajo ese valor |
| \(P_{50}\) | Mediana, \(Q_2\) | Deja aproximadamente el 50% de los datos en o bajo ese valor |
| \(P_{75}\) | \(Q_3\) | Deja aproximadamente el 75% de los datos en o bajo ese valor |
Los percentiles se usan cuando interesa comparar un resultado con el resto de un grupo.
Por eso aparecen con frecuencia en contextos como puntajes estandarizados, evaluaciones, crecimiento, salud, encuestas y análisis de rendimiento.
Ejercicio 1
Calcula \(P_{25}\), \(P_{50}\) y \(P_{75}\) del conjunto ordenado:
\[ 100,\ 120,\ 140,\ 160,\ 180,\ 200,\ 220,\ 240,\ 260,\ 280,\ 300,\ 320,\ 340,\ 360,\ 380,\ 400,\ 420,\ 440,\ 460 \]
Hay \(19\) datos, entonces:
\[ n+1=20 \]
Para \(P_{25}\):
\[ \text{Pos}(P_{25})=\frac{25\cdot 20}{100}=5 \]
El quinto dato es \(180\). Entonces:
\[ P_{25}=180 \]
Para \(P_{50}\):
\[ \text{Pos}(P_{50})=\frac{50\cdot 20}{100}=10 \]
El décimo dato es \(280\). Entonces:
\[ P_{50}=280 \]
Para \(P_{75}\):
\[ \text{Pos}(P_{75})=\frac{75\cdot 20}{100}=15 \]
El dato número \(15\) es \(380\). Entonces:
\[ P_{75}=380 \]
Ejercicio 2
Calcula \(P_{40}\) del conjunto ordenado:
\[ 6,\ 9,\ 11,\ 14,\ 18,\ 21,\ 25,\ 28,\ 31,\ 35 \]
Hay \(n=10\) datos.
\[ \text{Pos}(P_{40})=\frac{40(10+1)}{100}=\frac{440}{100}=4{,}4 \]
La posición \(4{,}4\) está entre el cuarto y el quinto dato:
\[ x_4=14,\qquad x_5=18 \]
La diferencia es:
\[ 18-14=4 \]
Entonces:
\[ P_{40}=14+0{,}4\cdot 4=14+1{,}6=15{,}6 \]
Respuesta:
\[ P_{40}=15{,}6 \]
Ejercicio 3
En un informe se indica que un estudiante quedó en el percentil 92 de una evaluación.
a) Explica qué significa esa información.
b) Explica qué no significa.
a) Sí significa: que aproximadamente el 92\% de los puntajes del grupo quedó en o bajo el resultado de ese estudiante.
Equivalentemente, aproximadamente el 8\% del grupo obtuvo un puntaje mayor.
b) No significa: que haya obtenido exactamente \(92\) puntos ni que haya respondido correctamente el \(92\%\) de la prueba.
Ejercicio 4
En una ojiva con frecuencia acumulada total \(500\), el nivel acumulado \(300\) se alcanza aproximadamente en el puntaje \(640\).
a) ¿Qué percentil representa ese valor?
b) ¿Qué interpretación corresponde a esa lectura?
c) Indica una conclusión que no puede hacerse solo con esa información.
a) Como:
\[ \frac{300}{500}=0{,}60 \]
ese valor representa el percentil 60:
\[ P_{60}\approx 640 \]
b) Significa que aproximadamente el 60\% de los puntajes está en o bajo \(640\), y aproximadamente el 40\% está por sobre ese valor.
c) No puede concluirse cuál es la media exacta del grupo ni cuáles son todos los puntajes individuales.
Ejercicio 5
Decide si cada afirmación es verdadera o falsa. Justifica.
- \(P_{50}\) se relaciona con la mediana.
- Los percentiles pueden calcularse sin ordenar los datos.
- Si una persona está en el percentil 30, entonces aproximadamente el 30% del grupo queda en o bajo su resultado.
- Conocer el percentil de una persona basta para saber la diferencia exacta entre su puntaje y el de otra persona.
1. Verdadera.
\(P_{50}\) deja aproximadamente al 50% de los datos en o bajo ese valor, por lo que se relaciona con la mediana.
2. Falsa.
Los percentiles son medidas de posición, por lo tanto se calculan sobre datos ordenados.
3. Verdadera.
Esa es precisamente la interpretación básica de \(P_{30}\): deja aproximadamente al 30% de los datos en o bajo ese valor.
4. Falsa.
El percentil ubica una posición relativa dentro del grupo, pero no entrega por sí solo la diferencia exacta entre puntajes.
Ticket de salida
- ¿Qué representa el percentil \(50\)?
- ¿Qué significa estar en el percentil \(85\)?
- Escribe una conclusión breve y bien justificada usando \(P_{75}\).
- Representa el valor que deja aproximadamente al 50% de los datos en o bajo él; se relaciona con la mediana.
- Significa que aproximadamente el 85% del grupo queda en o bajo ese resultado.
- Una posible respuesta es: “Si un resultado está por sobre \(P_{75}\), entonces se ubica en el tramo superior del grupo, por encima del valor que deja aproximadamente al 75\% de los datos en o bajo él”.
- Los percentiles dividen un conjunto ordenado en 100 partes.
- \(P_k\) deja aproximadamente al \(k\%\) de los datos en o bajo ese valor.
- \(P_{50}\) se relaciona con la mediana.
- Los percentiles son muy útiles para interpretar resultados estandarizados.
- La ojiva puede servir como apoyo visual para leer percentiles, pero no reemplaza por completo el análisis del contexto ni describe todos los datos individuales.
5. Relación entre cuartiles, deciles y percentiles [comparación conceptual]
Objetivo de la página
Comparar cuartiles, deciles y percentiles, reconociendo qué tienen en común, en qué se diferencian y cómo se interpretan como medidas de posición dentro de un conjunto de datos ordenados.
Ya estudiamos cuartiles, deciles y percentiles por separado.
Ahora conviene mirarlos en conjunto, porque los tres pertenecen a la misma familia: son medidas de posición.
La diferencia principal está en cuántas partes divide cada una al conjunto de datos ordenados.
| Medida | ¿En cuántas partes divide? | Ejemplos de notación | Interpretación |
|---|---|---|---|
| Cuartiles | 4 partes | \(Q_1,\ Q_2,\ Q_3\) | Ubican posiciones del 25%, 50% y 75% |
| Deciles | 10 partes | \(D_1,\ D_2,\dots,D_9\) | Ubican posiciones del 10%, 20%, ..., 90% |
| Percentiles | 100 partes | \(P_1,\ P_2,\dots,P_{99}\) | Ubican posiciones del 1%, 2%, ..., 99% |
Algunas medidas coinciden exactamente:
\[ Q_1=P_{25} \]
\[ Q_2=D_5=P_{50}=\text{mediana} \]
\[ Q_3=P_{75} \]
También se cumple, por ejemplo:
\[ D_1=P_{10},\quad D_2=P_{20},\quad D_3=P_{30},\quad \dots,\quad D_9=P_{90} \]
No todas las medidas se pueden emparejar de manera directa.
Por ejemplo:
\[ Q_1\neq D_2 \]
porque \(Q_1\) representa el 25\% y \(D_2\) representa el 20\%.
Del mismo modo:
\[ Q_3\neq D_7 \]
porque \(Q_3\) representa el 75\% y \(D_7\) representa el 70\%.
Ejemplo 1: comparación sobre un mismo conjunto ordenado
Considera el conjunto ordenado:
\[ 8,\ 10,\ 12,\ 14,\ 16,\ 18,\ 20,\ 22,\ 24,\ 26,\ 28,\ 30,\ 32,\ 34,\ 36,\ 38,\ 40,\ 42,\ 44 \]
Hay \(19\) datos, por lo tanto:
\[ n+1=20 \]
Relación entre \(Q_2\), \(D_5\) y \(P_{50}\)
\[ \text{Pos}(Q_2)=\text{mediana} \]
Como hay \(19\) datos, el dato central es el décimo:
\[ Q_2=26 \]
Ahora calculemos \(D_5\):
\[ \text{Pos}(D_5)=\frac{5(20)}{10}=10 \]
\[ D_5=26 \]
Y calculemos \(P_{50}\):
\[ \text{Pos}(P_{50})=\frac{50(20)}{100}=10 \]
\[ P_{50}=26 \]
Entonces:
\[ Q_2=D_5=P_{50}=26 \]
Conclusión: distintas notaciones pueden apuntar a la misma posición cuando representan el mismo porcentaje acumulado.
Ejemplo 2: comparación de equivalencias
Observemos ahora algunas equivalencias correctas y otras que no lo son:
| Expresión | ¿Es correcta? | Razón |
|---|---|---|
| \(Q_1=P_{25}\) | Sí | Ambos representan el 25% acumulado |
| \(Q_2=D_5\) | Sí | Ambos representan el 50% acumulado |
| \(D_8=P_{80}\) | Sí | Ambos representan el 80% acumulado |
| \(Q_1=D_2\) | No | \(25\%\neq 20\%\) |
| \(Q_3=D_7\) | No | \(75\%\neq 70\%\) |
Ejemplo 3: apoyo visual con ojiva acumulada 200
Una ojiva también permite comparar cuartiles, deciles y percentiles en una misma representación.
Esta vez usaremos una frecuencia acumulada total de 200. Eso significa que:
- el \(25\%\) corresponde a \(50\),
- el \(50\%\) corresponde a \(100\),
- el \(75\%\) corresponde a \(150\),
- el \(30\%\) corresponde a \(60\),
- el \(80\%\) corresponde a \(160\).
| Intervalo | Frecuencia | Frecuencia acumulada |
|---|---|---|
| \([300,400)\) | 20 | 20 |
| \([400,500)\) | 40 | 60 |
| \([500,600)\) | 40 | 100 |
| \([600,700)\) | 50 | 150 |
| \([700,800]\) | 50 | 200 |
Lectura de \(Q_1\) y \(P_{25}\)
Como el total es \(200\), el \(25\%\) corresponde a:
\[ 0{,}25\cdot 200=50 \]
En la ojiva, el acumulado \(50\) se ubica entre \(20\) y \(60\), por lo que cae en el intervalo \([400,500)\).
Una lectura aproximada entrega:
\[ Q_1=P_{25}\approx 475 \]
Lectura de \(D_3\) y \(P_{30}\)
El \(30\%\) de \(200\) es:
\[ 0{,}30\cdot 200=60 \]
En la ojiva, el acumulado \(60\) se alcanza en:
\[ D_3=P_{30}=500 \]
Lectura de \(Q_2\), \(D_5\) y \(P_{50}\)
El \(50\%\) de \(200\) es:
\[ 0{,}50\cdot 200=100 \]
En la ojiva, el acumulado \(100\) se alcanza en:
\[ Q_2=D_5=P_{50}=600 \]
Lectura de \(Q_3\) y \(P_{75}\)
El \(75\%\) de \(200\) es:
\[ 0{,}75\cdot 200=150 \]
En la ojiva, el acumulado \(150\) se alcanza en:
\[ Q_3=P_{75}=700 \]
Lectura de \(D_8\) y \(P_{80}\)
El \(80\%\) de \(200\) es:
\[ 0{,}80\cdot 200=160 \]
Ese valor cae entre \(150\) y \(200\), dentro del tramo \([700,800]\).
Una lectura aproximada da:
\[ D_8=P_{80}\approx 720 \]
Conclusión: la misma ojiva permite comparar medidas de posición distintas siempre que sepamos a qué porcentaje corresponde cada una.
Ejemplo 4: lectura contextual
Supongamos que en un informe aparecen estas tres afirmaciones:
- “El puntaje de Camila quedó sobre \(Q_3\)”
- “El puntaje de Diego quedó sobre \(D_8\)”
- “El puntaje de Sofía quedó sobre \(P_{80}\)”
Entonces:
- Camila quedó sobre el valor que deja aproximadamente al 75\% de los datos en o bajo él.
- Diego quedó sobre el valor que deja aproximadamente al 80\% de los datos en o bajo él.
- Sofía quedó sobre el valor que deja aproximadamente al 80\% de los datos en o bajo él.
Por lo tanto, en este caso:
\[ D_8=P_{80} \]
pero
\[ Q_3\neq D_8 \]
porque \(Q_3\) representa el 75\%, no el 80\%.
La idea matemática de base es la misma en los tres casos: ubicar una posición dentro del conjunto ordenado.
Lo que cambia es el nivel de precisión que se quiere describir:
- los cuartiles dan una descripción más global,
- los deciles permiten una división más fina,
- los percentiles entregan el mayor detalle.
Ejercicio 1
Completa la tabla:
| Medida | Porcentaje asociado |
|---|---|
| \(Q_1\) | __________ |
| \(D_4\) | __________ |
| \(P_{80}\) | __________ |
| \(Q_3\) | __________ |
Las correspondencias son:
\[ Q_1\rightarrow 25\% \]
\[ D_4\rightarrow 40\% \]
\[ P_{80}\rightarrow 80\% \]
\[ Q_3\rightarrow 75\% \]
Ejercicio 2
Indica cuáles equivalencias son correctas.
- \(Q_1=P_{25}\)
- \(Q_2=D_5\)
- \(Q_3=D_7\)
- \(D_8=P_{80}\)
1. Correcta. Ambos representan el 25%.
2. Correcta. Ambos representan el 50%.
3. Incorrecta. \(Q_3\) representa el 75% y \(D_7\) representa el 70%.
4. Correcta. Ambos representan el 80%.
Ejercicio 3
En una ojiva con frecuencia acumulada total \(200\), ¿a qué acumulado corresponde cada una de estas medidas?
- \(Q_1\)
- \(D_6\)
- \(P_{80}\)
- \(Q_3\)
1. \(Q_1\):
\[ 25\%\text{ de }200=50 \]
2. \(D_6\):
\[ 60\%\text{ de }200=120 \]
3. \(P_{80}\):
\[ 80\%\text{ de }200=160 \]
4. \(Q_3\):
\[ 75\%\text{ de }200=150 \]
Ejercicio 4
Explica por qué \(Q_2\), \(D_5\) y \(P_{50}\) representan la misma idea.
Representan la misma idea porque los tres apuntan al 50\% acumulado del conjunto.
Por eso se relacionan con la mediana, que divide el conjunto en dos partes de tamaño similar.
Ejercicio 5
Decide si cada afirmación es verdadera o falsa. Justifica.
- Todo cuartil coincide con un decil entero.
- \(D_3\) y \(P_{30}\) representan la misma posición porcentual.
- Los percentiles entregan una división más fina que los deciles.
1. Falsa.
No todo cuartil coincide con un decil entero. Por ejemplo, \(Q_1\) corresponde al 25%, y no existe un decil entero que represente exactamente el 25%.
2. Verdadera.
\(D_3\) representa el 30% y \(P_{30}\) también representa el 30%.
3. Verdadera.
Los percentiles dividen en 100 partes, mientras que los deciles dividen en 10 partes.
Ticket de salida
- ¿En qué se parecen cuartiles, deciles y percentiles?
- ¿Cuál de estas medidas entrega una división más fina: deciles o percentiles?
- En una ojiva con acumulado total \(200\), ¿qué nivel acumulado corresponde a \(Q_3\)?
- Se parecen en que las tres son medidas de posición y se calculan sobre datos ordenados.
- Los percentiles, porque dividen el conjunto en 100 partes.
- \(Q_3\) representa el 75%, por lo tanto corresponde a: \[ 0{,}75\cdot 200=150 \]
- Cuartiles, deciles y percentiles son medidas de posición.
- Los cuartiles dividen en 4 partes, los deciles en 10 y los percentiles en 100.
- \(Q_1=P_{25}\), \(\;Q_2=D_5=P_{50}\), \(\;Q_3=P_{75}\).
- \(D_k\) equivale a \(P_{10k}\).
- Una ojiva permite comparar todas estas medidas si se traduce cada una a su porcentaje acumulado correspondiente.
6. Resumen de cinco números [mínimo, \(Q_1\), mediana, \(Q_3\), máximo]
Objetivo de la página
Construir e interpretar el resumen de cinco números de un conjunto de datos, reconociendo su utilidad para sintetizar la posición y la dispersión mediante el mínimo, el primer cuartil, la mediana, el tercer cuartil y el máximo.
Ya estudiamos el rango, los cuartiles, los deciles y los percentiles.
Ahora reuniremos parte de esas ideas en una síntesis muy útil: el resumen de cinco números.
Esta herramienta permite describir rápidamente cómo se distribuyen los datos sin escribir todo el conjunto completo.
Es una forma breve de resumir un conjunto de datos ordenados usando estos cinco valores:
- Mínimo: el menor dato.
- \(Q_1\): primer cuartil.
- Mediana: valor central del conjunto.
- \(Q_3\): tercer cuartil.
- Máximo: el mayor dato.
Se suele escribir así:
\[ (\text{mínimo},\ Q_1,\ \text{mediana},\ Q_3,\ \text{máximo}) \]
- Ordena los datos de menor a mayor.
- Identifica el mínimo y el máximo.
- Calcula la mediana.
- Calcula \(Q_1\) y \(Q_3\) con el mismo criterio usado en las páginas anteriores.
- Escribe los cinco valores en orden.
Así se obtiene una descripción rápida del centro y de la dispersión del conjunto.
El resumen de cinco números no incluye la media aritmética.
Está formado solo por:
\[ \text{mínimo},\ Q_1,\ \text{mediana},\ Q_3,\ \text{máximo} \]
Ejemplo 1: construir el resumen de cinco números
Considera el conjunto:
\[ 12,\ 7,\ 15,\ 10,\ 8,\ 18,\ 11,\ 9,\ 14 \]
Paso 1: ordenar
\[ 7,\ 8,\ 9,\ 10,\ 11,\ 12,\ 14,\ 15,\ 18 \]
Paso 2: identificar mínimo y máximo
\[ \text{mínimo}=7,\qquad \text{máximo}=18 \]
Paso 3: calcular la mediana
Como hay \(9\) datos, el valor central es el quinto:
\[ \text{mediana}=11 \]
Paso 4: calcular \(Q_1\) y \(Q_3\)
Mitad inferior: \(\{7,8,9,10\}\)
Mitad superior: \(\{12,14,15,18\}\)
\[ Q_1=\frac{8+9}{2}=8{,}5 \]
\[ Q_3=\frac{14+15}{2}=14{,}5 \]
Resumen de cinco números:
\[ (7,\ 8{,}5,\ 11,\ 14{,}5,\ 18) \]
Ejemplo 2: otro caso con cantidad par de datos
Ahora consideremos:
\[ 5,\ 6,\ 8,\ 9,\ 11,\ 13,\ 15,\ 18 \]
Los datos ya están ordenados.
Mínimo y máximo
\[ \text{mínimo}=5,\qquad \text{máximo}=18 \]
Mediana
Como hay \(8\) datos, la mediana es el promedio entre el cuarto y el quinto:
\[ \text{mediana}=\frac{9+11}{2}=10 \]
Cuartiles
Mitad inferior: \(\{5,6,8,9\}\)
Mitad superior: \(\{11,13,15,18\}\)
\[ Q_1=\frac{6+8}{2}=7 \]
\[ Q_3=\frac{13+15}{2}=14 \]
Resumen de cinco números:
\[ (5,\ 7,\ 10,\ 14,\ 18) \]
Ejemplo 3: interpretación del resumen
Supongamos que el resumen de cinco números de un grupo es:
\[ (420,\ 480,\ 530,\ 610,\ 700) \]
Esto significa que:
- el puntaje mínimo fue \(420\),
- aproximadamente el \(25\%\) de los puntajes queda en o bajo \(480\),
- aproximadamente el \(50\%\) de los puntajes queda en o bajo \(530\),
- aproximadamente el \(75\%\) de los puntajes queda en o bajo \(610\),
- el puntaje máximo fue \(700\).
Así, sin mirar todos los datos uno por uno, ya tenemos una visión general del comportamiento del grupo.
Ejemplo 4: apoyo visual hacia el boxplot
El resumen de cinco números sirve directamente para construir un gráfico de caja.
Si tomamos el resumen:
\[ (7,\ 8{,}5,\ 11,\ 14{,}5,\ 18) \]
podemos representarlo visualmente así:
En la siguiente página veremos cómo se construye e interpreta esa representación paso a paso.
El resumen de cinco números permite:
- describir un conjunto de datos de forma breve,
- ubicar el centro mediante la mediana,
- observar cómo se reparten los datos usando \(Q_1\) y \(Q_3\),
- identificar la amplitud general a partir del mínimo y el máximo.
| Elemento | Qué representa |
|---|---|
| Mínimo | El menor dato del conjunto |
| \(Q_1\) | El valor bajo el cual queda aproximadamente el 25% de los datos |
| Mediana | El valor central; aproximadamente el 50% de los datos queda en o bajo él |
| \(Q_3\) | El valor bajo el cual queda aproximadamente el 75% de los datos |
| Máximo | El mayor dato del conjunto |
Ejercicio 1
Construye el resumen de cinco números del conjunto:
\[ 4,\ 7,\ 9,\ 10,\ 12,\ 14,\ 18 \]
Los datos ya están ordenados.
\[ \text{mínimo}=4,\qquad \text{máximo}=18 \]
Como hay \(7\) datos, la mediana es el cuarto valor:
\[ \text{mediana}=10 \]
Mitad inferior: \(\{4,7,9\}\)
Mitad superior: \(\{12,14,18\}\)
\[ Q_1=7,\qquad Q_3=14 \]
Resumen de cinco números:
\[ (4,\ 7,\ 10,\ 14,\ 18) \]
Ejercicio 2
Construye el resumen de cinco números del conjunto ordenado:
\[ 3,\ 5,\ 6,\ 8,\ 10,\ 12,\ 14,\ 17 \]
\[ \text{mínimo}=3,\qquad \text{máximo}=17 \]
Como hay \(8\) datos, la mediana es:
\[ \text{mediana}=\frac{8+10}{2}=9 \]
Mitad inferior: \(\{3,5,6,8\}\)
Mitad superior: \(\{10,12,14,17\}\)
\[ Q_1=\frac{5+6}{2}=5{,}5 \]
\[ Q_3=\frac{12+14}{2}=13 \]
Resumen de cinco números:
\[ (3,\ 5{,}5,\ 9,\ 13,\ 17) \]
Ejercicio 3
El resumen de cinco números de un grupo de puntajes es:
\[ (380,\ 450,\ 520,\ 610,\ 740) \]
Interpreta el significado de \(450\), \(520\) y \(610\).
En ese resumen:
- \(450\) corresponde a \(Q_1\), así que aproximadamente el \(25\%\) de los puntajes queda en o bajo ese valor.
- \(520\) corresponde a la mediana, así que aproximadamente el \(50\%\) de los puntajes queda en o bajo ese valor.
- \(610\) corresponde a \(Q_3\), así que aproximadamente el \(75\%\) de los puntajes queda en o bajo ese valor.
Ejercicio 4
Decide si cada afirmación es verdadera o falsa. Justifica.
- El resumen de cinco números incluye la media aritmética.
- La mediana forma parte del resumen de cinco números.
- \(Q_1\) y \(Q_3\) forman parte del resumen de cinco números.
1. Falsa.
La media no forma parte del resumen de cinco números.
2. Verdadera.
La mediana es uno de los cinco valores del resumen.
3. Verdadera.
El primer y el tercer cuartil son parte fundamental del resumen.
Ejercicio 5
Dos conjuntos tienen estos resúmenes de cinco números:
| Conjunto | Resumen de cinco números |
|---|---|
| A | \((5,\ 8,\ 10,\ 13,\ 16)\) |
| B | \((5,\ 7,\ 10,\ 15,\ 16)\) |
Explica una diferencia importante entre ambos.
Ambos conjuntos tienen el mismo mínimo, la misma mediana y el mismo máximo:
\[ 5,\qquad 10,\qquad 16 \]
Pero cambian los cuartiles:
\[ Q_1(A)=8,\quad Q_3(A)=13 \]
\[ Q_1(B)=7,\quad Q_3(B)=15 \]
Eso sugiere que en el conjunto B la parte central está más extendida que en el conjunto A.
Ticket de salida
- ¿Cuáles son los cinco valores que forman este resumen?
- ¿Por qué se relaciona directamente con los cuartiles?
- ¿Para qué servirá este resumen en la página siguiente?
- Lo forman el mínimo, \(Q_1\), la mediana, \(Q_3\) y el máximo.
- Porque incluye \(Q_1\), la mediana y \(Q_3\), que son medidas de posición basadas en cuartiles.
- Servirá para construir e interpretar el boxplot o gráfico de caja.
- El resumen de cinco números sintetiza un conjunto con solo cinco valores.
- Se construye con: mínimo, \(Q_1\), mediana, \(Q_3\) y máximo.
- No incluye la media aritmética.
- Permite describir centro y dispersión de manera breve.
- Es la base directa para construir el gráfico de caja.
7. Boxplot I [construcción paso a paso]
Objetivo de la página
Construir un boxplot o gráfico de caja a partir del resumen de cinco números, identificando correctamente sus elementos básicos: mínimo, \(Q_1\), mediana, \(Q_3\) y máximo.
En la página anterior construimos el resumen de cinco números.
Ahora usaremos esa información para dibujar una representación visual muy importante: el boxplot.
En esta página nos enfocaremos en cómo se construye. La interpretación más profunda del gráfico la trabajaremos después.
El boxplot, también llamado gráfico de caja o diagrama de cajón, es una representación visual construida a partir de cinco valores:
\[ \text{mínimo},\quad Q_1,\quad \text{mediana},\quad Q_3,\quad \text{máximo} \]
Estos cinco valores resumen cómo se distribuyen los datos y permiten observar, de un vistazo, su posición y dispersión.
- Ordena los datos.
- Calcula el mínimo, \(Q_1\), la mediana, \(Q_3\) y el máximo.
- Dibuja una recta horizontal con una escala adecuada.
- Marca sobre la recta los cinco valores del resumen.
- Dibuja una caja desde \(Q_1\) hasta \(Q_3\).
- Traza una línea vertical en la mediana.
- Dibuja los segmentos exteriores desde el mínimo hasta \(Q_1\) y desde \(Q_3\) hasta el máximo.
- Construir el boxplot sin ordenar antes los datos.
- Confundir la mediana con la media.
- Ubicar mal \(Q_1\) o \(Q_3\).
- Dibujar la caja desde el mínimo hasta el máximo. Eso es incorrecto.
La caja siempre va desde \(Q_1\) hasta \(Q_3\).
Ejemplo 1: desde los datos al resumen de cinco números
Considera el conjunto:
\[ 12,\ 7,\ 15,\ 10,\ 8,\ 18,\ 11,\ 9,\ 14 \]
Paso 1: ordenar
\[ 7,\ 8,\ 9,\ 10,\ 11,\ 12,\ 14,\ 15,\ 18 \]
Paso 2: mínimo y máximo
\[ \text{mínimo}=7,\qquad \text{máximo}=18 \]
Paso 3: mediana
Como hay \(9\) datos, el valor central es el quinto:
\[ \text{mediana}=11 \]
Paso 4: cuartiles
Mitad inferior: \(\{7,8,9,10\}\)
Mitad superior: \(\{12,14,15,18\}\)
\[ Q_1=\frac{8+9}{2}=8{,}5 \]
\[ Q_3=\frac{14+15}{2}=14{,}5 \]
Resumen de cinco números:
\[ (7,\ 8{,}5,\ 11,\ 14{,}5,\ 18) \]
Ejemplo 2: desde el resumen al boxplot
Usaremos ahora el resumen obtenido:
\[ (7,\ 8{,}5,\ 11,\ 14{,}5,\ 18) \]
| Elemento | Valor |
|---|---|
| Mínimo | \(7\) |
| \(Q_1\) | \(8{,}5\) |
| Mediana | \(11\) |
| \(Q_3\) | \(14{,}5\) |
| Máximo | \(18\) |
Construcción conceptual:
- Se marca el mínimo en \(7\).
- Se marca \(Q_1\) en \(8{,}5\).
- Se marca la mediana en \(11\).
- Se marca \(Q_3\) en \(14{,}5\).
- Se marca el máximo en \(18\).
- Se dibuja la caja desde \(8{,}5\) hasta \(14{,}5\).
- Se dibuja la línea interior de la mediana en \(11\).
- Se unen el mínimo con \(Q_1\) y \(Q_3\) con el máximo.
En este boxplot, la caja representa el tramo entre \(Q_1\) y \(Q_3\), mientras que la línea interior corresponde a la mediana.
Ejemplo 3: segundo ejemplo de construcción
Considera ahora los datos ordenados:
\[ 4,\ 5,\ 6,\ 6,\ 7,\ 8,\ 9,\ 10,\ 11,\ 13 \]
Mínimo y máximo
\[ \text{mínimo}=4,\qquad \text{máximo}=13 \]
Mediana
\[ \text{mediana}=\frac{7+8}{2}=7{,}5 \]
Cuartiles
Mitad inferior: \(\{4,5,6,6,7\}\)
Mitad superior: \(\{8,9,10,11,13\}\)
\[ Q_1=6,\qquad Q_3=10 \]
Resumen de cinco números:
\[ (4,\ 6,\ 7{,}5,\ 10,\ 13) \]
Con esos cinco valores ya se puede construir el boxplot correspondiente.
| Elemento | Ubicación en el gráfico | Significado |
|---|---|---|
| Mínimo | Extremo izquierdo | Menor dato del conjunto |
| \(Q_1\) | Borde izquierdo de la caja | Deja aproximadamente el 25% de los datos en o bajo ese valor |
| Mediana | Línea dentro de la caja | Valor central del conjunto |
| \(Q_3\) | Borde derecho de la caja | Deja aproximadamente el 75% de los datos en o bajo ese valor |
| Máximo | Extremo derecho | Mayor dato del conjunto |
El boxplot no se construye directamente “a ojo” desde los datos sueltos.
Primero se obtiene el resumen de cinco números y recién después se dibuja el gráfico.
Por eso, si el resumen está mal calculado, el boxplot también quedará mal construido.
Ejercicio 1
Construye el resumen de cinco números del conjunto:
\[ 5,\ 7,\ 8,\ 10,\ 12,\ 13,\ 15 \]
Luego indica con esos valores cómo se ubicaría el boxplot.
Los datos ya están ordenados.
\[ \text{mínimo}=5,\qquad \text{máximo}=15 \]
Como hay \(7\) datos, la mediana es el cuarto valor:
\[ \text{mediana}=10 \]
Mitad inferior: \(\{5,7,8\}\)
Mitad superior: \(\{12,13,15\}\)
\[ Q_1=7,\qquad Q_3=13 \]
Resumen de cinco números:
\[ (5,\ 7,\ 10,\ 13,\ 15) \]
Entonces, en el boxplot:
- la caja va desde \(7\) hasta \(13\),
- la línea interior va en \(10\),
- los extremos quedan en \(5\) y \(15\).
Ejercicio 2
Construye el resumen de cinco números del conjunto ordenado:
\[ 2,\ 4,\ 5,\ 7,\ 8,\ 9,\ 11,\ 13 \]
Luego escribe desde qué valor hasta qué valor se dibuja la caja.
\[ \text{mínimo}=2,\qquad \text{máximo}=13 \]
Como hay \(8\) datos, la mediana es:
\[ \text{mediana}=\frac{7+8}{2}=7{,}5 \]
Mitad inferior: \(\{2,4,5,7\}\)
Mitad superior: \(\{8,9,11,13\}\)
\[ Q_1=\frac{4+5}{2}=4{,}5 \]
\[ Q_3=\frac{9+11}{2}=10 \]
Resumen de cinco números:
\[ (2,\ 4{,}5,\ 7{,}5,\ 10,\ 13) \]
La caja se dibuja desde \(Q_1=4{,}5\) hasta \(Q_3=10\).
Ejercicio 3
El resumen de cinco números de un conjunto es:
\[ (6,\ 9,\ 12,\ 16,\ 20) \]
Indica:
- dónde comienza y termina la caja,
- dónde se ubica la mediana,
- cuáles son los extremos del gráfico.
Como el resumen es:
\[ (6,\ 9,\ 12,\ 16,\ 20) \]
- la caja comienza en \(9\) y termina en \(16\),
- la mediana se ubica en \(12\),
- los extremos del gráfico son \(6\) y \(20\).
Ejercicio 4
Decide si cada afirmación es verdadera o falsa. Justifica.
- La caja de un boxplot va desde el mínimo hasta el máximo.
- La línea interior de la caja representa la mediana.
- Para construir un boxplot se necesita el resumen de cinco números.
1. Falsa.
La caja no va desde el mínimo hasta el máximo, sino desde \(Q_1\) hasta \(Q_3\).
2. Verdadera.
La línea interior de la caja representa la mediana.
3. Verdadera.
El boxplot se construye a partir del mínimo, \(Q_1\), la mediana, \(Q_3\) y el máximo.
Ejercicio 5
Completa los espacios usando las palabras: mínimo, \(Q_1\), mediana, \(Q_3\), máximo.
- El borde izquierdo de la caja corresponde a __________.
- El borde derecho de la caja corresponde a __________.
- La línea interior corresponde a la __________.
- Los extremos exteriores corresponden al __________ y al __________.
- El borde izquierdo de la caja corresponde a \(Q_1\).
- El borde derecho de la caja corresponde a \(Q_3\).
- La línea interior corresponde a la mediana.
- Los extremos exteriores corresponden al mínimo y al máximo.
Ticket de salida
- ¿Con qué cinco valores se construye un boxplot?
- ¿Entre qué dos valores se dibuja la caja?
- ¿Qué valor representa la línea interior del boxplot?
- Se construye con el mínimo, \(Q_1\), la mediana, \(Q_3\) y el máximo.
- La caja se dibuja entre \(Q_1\) y \(Q_3\).
- La línea interior representa la mediana.
- El boxplot se construye a partir del resumen de cinco números.
- La caja va desde \(Q_1\) hasta \(Q_3\).
- La línea interior representa la mediana.
- Los extremos representan el mínimo y el máximo.
- En la siguiente página nos concentraremos en interpretar lo que muestra un boxplot.
8. Boxplot II [interpretación, asimetría, dispersión, posibles atípicos]
Objetivo de la página
Interpretar boxplots en contexto, comparando centro, dispersión, asimetría y posibles valores atípicos, para justificar conclusiones sobre distintos conjuntos de datos.
En la página anterior aprendimos a construir un boxplot a partir del resumen de cinco números.
Ahora nos centraremos en lo más importante: leerlo, compararlo y sacar conclusiones justificadas.
En un curso diferenciado no basta con identificar \(Q_1\), la mediana o \(Q_3\); también interesa explicar qué nos permite concluir el gráfico y qué no.
- La mediana permite ubicar una posición central del conjunto.
- La caja, desde \(Q_1\) hasta \(Q_3\), contiene el 50\% central de los datos.
- Una caja más ancha sugiere mayor dispersión en la zona central.
- Los tramos desde el mínimo hasta \(Q_1\) y desde \(Q_3\) hasta el máximo ayudan a observar cómo se extienden los extremos.
- Si un lado es mucho más largo que el otro, el gráfico puede sugerir asimetría.
- Si aparece un extremo muy separado del resto, puede haber un valor extremo o un posible atípico.
- ¿Dónde está la mediana?
- ¿La caja es ancha o angosta?
- ¿Los tramos izquierdo y derecho son parecidos o muy distintos?
- ¿Hay algún valor muy alejado del resto?
- ¿Qué conclusión tiene respaldo en el gráfico y cuál sería exagerada?
Un boxplot no muestra todos los datos uno por uno.
Por eso, desde un boxplot no siempre se puede afirmar cuántos datos exactos se repiten, cuál es la media o cómo son todos los valores intermedios.
El análisis debe apoyarse en lo que el gráfico realmente muestra: posición, dispersión y forma general.
Ejemplo 1: misma mediana, distinta dispersión
Dos grupos de puntajes tienen estos resúmenes de cinco números:
| Grupo | Resumen de cinco números |
|---|---|
| A | \((420,\ 500,\ 560,\ 610,\ 680)\) |
| B | \((420,\ 470,\ 560,\ 650,\ 680)\) |
Los dos grupos tienen la misma mediana:
\[ 560 \]
Pero sus cajas no tienen el mismo ancho.
En el grupo A, la amplitud intercuartílica es:
\[ 610-500=110 \]
En el grupo B, la amplitud intercuartílica es:
\[ 650-470=180 \]
Conclusión: aunque ambos grupos comparten la misma posición central, el grupo B presenta mayor dispersión en el 50\% central de sus datos.
Ejemplo 2: leer asimetría con cautela
Observa este resumen:
\[ (8,\ 10,\ 11,\ 13,\ 25) \]
El tramo derecho desde \(Q_3\) hasta el máximo mide:
\[ 25-13=12 \]
El tramo izquierdo desde el mínimo hasta \(Q_1\) mide:
\[ 10-8=2 \]
Además, la mediana está más cerca de \(Q_1\) que de \(Q_3\).
Interpretación razonable: el gráfico sugiere asimetría hacia la derecha, porque los valores altos se extienden mucho más.
El boxplot no prueba por sí solo una “regla absoluta” sobre la distribución, pero sí entrega una señal clara de que el lado derecho está más extendido.
Ejemplo 3: posible valor atípico
Considera ahora este resumen:
\[ (14,\ 15,\ 16,\ 17,\ 35) \]
La caja está muy concentrada entre \(15\) y \(17\), pero el máximo llega hasta \(35\).
Interpretación razonable: el gráfico sugiere que existe un valor alto muy alejado del resto.
En una lectura escolar, eso puede describirse como un posible atípico o como un valor extremo que conviene revisar.
Decir “posible atípico” es más riguroso que afirmar automáticamente “atípico” sin usar un criterio formal adicional.
Ejemplo 4: comparación en contexto
Dos cursos rindieron la misma evaluación. Sus boxplots se resumen así:
| Curso | Resumen de cinco números |
|---|---|
| 1°A | \((380,\ 470,\ 540,\ 610,\ 690)\) |
| 1°B | \((400,\ 520,\ 560,\ 590,\ 620)\) |
Análisis:
- La mediana de 1°B es mayor: \[ 560>540 \]
- La caja de 1°B es más angosta: \[ 590-520=70 \] mientras que en 1°A: \[ 610-470=140 \]
- Además, el rango total de 1°B también es menor: \[ 620-400=220 \] frente a \[ 690-380=310 \]
Conclusión mejor justificada: el curso 1°B no solo tiene un rendimiento central algo mayor, sino también resultados más concentrados.
Si una jefatura preguntara cuál curso muestra un desempeño más homogéneo, el boxplot respalda mejor la elección de 1°B, porque su caja y su rango total son menores.
| Señal en el boxplot | Lectura posible |
|---|---|
| Caja más ancha | Mayor dispersión en el 50% central |
| Caja más angosta | Mayor concentración en el 50% central |
| Tramo derecho mucho más largo | Posible asimetría hacia la derecha |
| Tramo izquierdo mucho más largo | Posible asimetría hacia la izquierda |
| Valor extremo muy alejado | Posible dato atípico o valor extremo |
Una respuesta débil dice solo: “el curso B es mejor”.
Una respuesta sólida dice, por ejemplo: “el curso B tiene una mediana mayor y una menor amplitud intercuartílica, por eso presenta puntajes centrales más altos y más concentrados”.
En estadística, concluir sin justificar no basta: hay que apoyar la afirmación en elementos concretos del gráfico.
Ejercicio 1
Un boxplot tiene resumen de cinco números:
\[ (10,\ 14,\ 16,\ 18,\ 22) \]
a) ¿Dónde está la posición central?
b) ¿Entre qué valores se encuentra el 50\% central?
c) ¿El gráfico sugiere gran o pequeña dispersión en esa zona central? Justifica con lo que sí se observa.
a) La posición central está en la mediana:
\[ 16 \]
b) El 50\% central se encuentra entre:
\[ Q_1=14 \qquad \text{y} \qquad Q_3=18 \]
c) La dispersión central no parece grande, porque la caja mide:
\[ 18-14=4 \]
Eso indica que la mitad central de los datos está relativamente concentrada en un tramo corto.
Ejercicio 2
Dos conjuntos tienen estos resúmenes:
| Conjunto | Resumen |
|---|---|
| A | \((5,\ 9,\ 12,\ 15,\ 18)\) |
| B | \((5,\ 7,\ 12,\ 17,\ 18)\) |
¿Cuál tiene mayor dispersión en el 50\% central? Explica.
El conjunto B.
En A, la amplitud intercuartílica es:
\[ 15-9=6 \]
En B, la amplitud intercuartílica es:
\[ 17-7=10 \]
Como la caja de B sería más ancha, el 50\% central está más disperso en ese conjunto.
Ejercicio 3
Un boxplot tiene resumen:
\[ (6,\ 8,\ 9,\ 11,\ 24) \]
¿Qué tipo de asimetría sugiere? ¿Qué valor del resumen ayuda más a notar esa situación?
Sugiere asimetría hacia la derecha.
La señal principal es que el tramo derecho es mucho mayor:
\[ 24-11=13 \]
mientras que el tramo izquierdo mide:
\[ 8-6=2 \]
El valor que más llama la atención es el máximo \(24\), porque está muy alejado respecto de \(Q_3\).
Ejercicio 4
Una estudiante afirma: “Como dos boxplots tienen la misma mediana, entonces sus distribuciones son prácticamente iguales”.
¿Estás de acuerdo? Justifica con un argumento estadístico.
No estoy de acuerdo.
Tener la misma mediana solo indica que comparten una posición central similar, pero aún pueden diferir en:
- la amplitud intercuartílica,
- el rango total,
- la asimetría,
- la presencia de valores extremos.
Por eso, dos boxplots con la misma mediana pueden representar conjuntos bastante distintos.
Ejercicio 5
Decide si cada afirmación es verdadera o falsa. Justifica.
- Una caja más angosta sugiere menor dispersión del 50\% central.
- Si el tramo derecho es mucho más largo que el izquierdo, el gráfico puede sugerir asimetría hacia la derecha.
- Desde un boxplot siempre se puede saber el valor exacto de la media.
1. Verdadera.
La caja representa el tramo entre \(Q_1\) y \(Q_3\). Si es más angosta, el 50\% central está más concentrado.
2. Verdadera.
Ese es uno de los indicios habituales de asimetría hacia la derecha.
3. Falsa.
El boxplot no entrega la media de manera directa; muestra mínimo, \(Q_1\), mediana, \(Q_3\) y máximo.
Ticket de salida
- ¿Qué parte del boxplot permite describir el 50\% central de los datos?
- ¿Qué señal puede sugerir asimetría hacia la derecha?
- Escribe una conclusión breve pero justificada a partir de esta frase: “El conjunto B tiene la misma mediana que A, pero una caja más ancha”.
- La caja, que va desde \(Q_1\) hasta \(Q_3\).
- Que el tramo derecho sea claramente más largo que el izquierdo, o que el máximo quede mucho más alejado de \(Q_3\).
- Una posible conclusión es: “Ambos conjuntos tienen una posición central similar, pero en B el 50\% central de los datos está más disperso, porque su caja es más ancha”.
- Interpretar un boxplot exige mirar mediana, caja y extremos.
- La caja muestra la dispersión del 50\% central.
- Los lados desiguales pueden sugerir asimetría.
- Un extremo muy alejado puede sugerir un posible atípico.
- Una buena conclusión estadística debe estar justificada con elementos del gráfico.
9. Comparación de conjuntos de datos con boxplot [decisiones y conclusiones] (PAES M1)
Objetivo de la página
Comparar conjuntos de datos mediante boxplots, justificando conclusiones sobre posición central, dispersión, asimetría y posibles valores extremos en distintos contextos.
En la página anterior aprendimos a interpretar un boxplot individual.
Ahora daremos un paso más: comparar dos o más boxplots para tomar decisiones y sostener conclusiones con evidencia gráfica.
Este tipo de lectura es muy útil cuando se quiere comparar cursos, grupos, rendimientos, tiempos, puntajes o resultados de distintas experiencias.
- La mediana: permite comparar la posición central de los conjuntos.
- La caja: muestra el 50% central de los datos; una caja más ancha indica mayor dispersión en esa zona.
- Los extremos: ayudan a comparar la extensión total de los datos.
- La forma general: puede sugerir asimetría hacia la izquierda o hacia la derecha.
- Valores muy alejados: pueden sugerir un posible dato extremo o atípico.
No basta con decir “un grupo es mejor” o “un grupo está más disperso”.
La comparación debe apoyarse en elementos concretos del gráfico, por ejemplo:
- “la mediana de A es mayor que la de B”,
- “la caja de B es más angosta que la de A”,
- “el tramo derecho de C es mucho más largo que el izquierdo”.
Una mediana más alta no implica automáticamente que todo el conjunto sea “mejor”.
También puede haber mayor dispersión, más desigualdad interna o valores extremos que cambien la lectura del contexto.
Ejemplo 1: misma mediana, distinta dispersión
Dos grupos tienen estos resúmenes de cinco números:
| Grupo | Resumen de cinco números |
|---|---|
| A | \((420,\ 500,\ 560,\ 610,\ 680)\) |
| B | \((420,\ 470,\ 560,\ 650,\ 680)\) |
Ambos grupos tienen la misma mediana:
\[ 560 \]
Pero la amplitud intercuartílica no es la misma.
Grupo A:
\[ 610-500=110 \]
Grupo B:
\[ 650-470=180 \]
Conclusión: ambos grupos tienen la misma posición central, pero el grupo B presenta mayor dispersión en el 50% central de sus datos.
Ejemplo 2: mejor posición central y mayor homogeneidad
En una evaluación, dos cursos obtuvieron estos resúmenes:
| Curso | Resumen de cinco números |
|---|---|
| 1°A | \((380,\ 470,\ 540,\ 610,\ 690)\) |
| 1°B | \((400,\ 520,\ 560,\ 590,\ 620)\) |
Análisis de la mediana:
\[ 560>540 \]
Análisis de la dispersión central:
En 1°A:
\[ 610-470=140 \]
En 1°B:
\[ 590-520=70 \]
Análisis del rango total:
En 1°A:
\[ 690-380=310 \]
En 1°B:
\[ 620-400=220 \]
Conclusión: el curso 1°B presenta una mediana algo mayor y, además, resultados más homogéneos, porque su caja y su rango total son menores.
Ejemplo 3: misma dispersión central, distinta forma
Observa estos dos conjuntos:
| Conjunto | Resumen de cinco números |
|---|---|
| C | \((8,\ 10,\ 12,\ 14,\ 16)\) |
| D | \((4,\ 10,\ 12,\ 14,\ 25)\) |
Ambos tienen la misma caja:
\[ Q_1=10,\qquad \text{mediana}=12,\qquad Q_3=14 \]
Por eso, el 50% central se comporta de manera parecida en ambos conjuntos.
Sin embargo, los extremos son muy distintos:
- en C, los extremos quedan cerca de la caja,
- en D, el máximo \(25\) queda mucho más alejado y el mínimo \(4\) también se separa más del centro.
Conclusión: dos boxplots pueden compartir la misma zona central y, aun así, diferir bastante en sus extremos y en la forma general del conjunto.
Ejemplo 4: decisión en contexto
Una profesora quiere escoger entre dos cursos para representar al colegio en una actividad donde importa que el rendimiento sea alto y parejo.
Los resúmenes de cinco números son:
| Curso | Resumen de cinco números |
|---|---|
| X | \((410,\ 450,\ 590,\ 640,\ 700)\) |
| Y | \((500,\ 540,\ 580,\ 610,\ 640)\) |
La mediana de X es levemente mayor:
\[ 590>580 \]
Pero la dispersión de X es mucho mayor:
\[ 640-450=190 \]
Mientras que en Y:
\[ 610-540=70 \]
Decisión mejor argumentada: si lo prioritario es un desempeño más parejo, conviene escoger el curso Y. Aunque X tiene una mediana algo mayor, Y muestra mucha más homogeneidad.
Sí se puede concluir desde boxplots que un grupo tiene mayor mediana, mayor dispersión central o extremos más alejados.
No se puede concluir directamente cuántos estudiantes exactos obtuvieron cierto puntaje, cuál es la media aritmética o cómo son todos los datos internos del conjunto.
| Situación observada | Forma adecuada de justificar |
|---|---|
| Mediana mayor | “La posición central del conjunto A es mayor que la de B, porque su mediana está más a la derecha.” |
| Caja más ancha | “El 50% central de A está más disperso que el de B, porque su caja es más ancha.” |
| Extremo muy alejado | “A presenta un valor extremo alto que se separa claramente del resto del conjunto.” |
| Tramo derecho más largo | “El gráfico sugiere asimetría hacia la derecha, porque los valores altos se extienden más.” |
Ejercicio 1
Dos conjuntos tienen estos resúmenes:
| Conjunto | Resumen |
|---|---|
| A | \((5,\ 8,\ 11,\ 14,\ 17)\) |
| B | \((5,\ 6,\ 11,\ 16,\ 17)\) |
¿Cuál tiene mayor dispersión en el 50% central? Justifica.
El conjunto B.
En A, la amplitud intercuartílica es:
\[ 14-8=6 \]
En B, la amplitud intercuartílica es:
\[ 16-6=10 \]
Como la caja de B sería más ancha, el 50% central de sus datos está más disperso.
Ejercicio 2
Un curso A tiene resumen \((400,\ 480,\ 550,\ 620,\ 700)\) y un curso B tiene resumen \((430,\ 520,\ 560,\ 590,\ 630)\).
¿Cuál curso muestra resultados más homogéneos? Justifica con al menos dos argumentos.
El curso B muestra resultados más homogéneos.
Primer argumento: su amplitud intercuartílica es menor:
\[ 590-520=70 \]
mientras que en A es:
\[ 620-480=140 \]
Segundo argumento: su rango total también es menor:
\[ 630-430=200 \]
mientras que en A es:
\[ 700-400=300 \]
Por eso, B presenta datos más concentrados tanto en la parte central como en el conjunto total.
Ejercicio 3
Dos boxplots tienen la misma mediana, pero uno de ellos tiene un máximo mucho más alejado de \(Q_3\).
¿Qué conclusión razonable puede extraerse?
Puede concluirse que, aunque ambos conjuntos tienen una posición central similar, uno de ellos presenta mayor extensión hacia los valores altos.
Eso puede sugerir asimetría hacia la derecha o la presencia de un valor extremo alto.
Ejercicio 4
Una estudiante dice: “Como el boxplot del grupo A tiene la mediana más alta, entonces todos los estudiantes de A obtuvieron mejores resultados que los de B”.
¿La conclusión es correcta? Explica.
No, esa conclusión no es correcta.
Que A tenga una mediana más alta solo indica que su posición central es mayor, pero no significa que todos sus datos sean mayores que todos los de B.
Los boxplots pueden solaparse y seguir mostrando medianas distintas.
Ejercicio 5
Decide si cada afirmación es verdadera o falsa. Justifica.
- Si dos boxplots tienen la misma mediana, entonces necesariamente tienen la misma dispersión.
- Una caja más angosta sugiere mayor concentración en el 50% central.
- Desde un boxplot siempre se puede conocer el valor exacto de la media.
1. Falsa.
La mediana informa sobre la posición central, no sobre toda la dispersión. Dos conjuntos pueden compartir mediana y tener cajas muy distintas.
2. Verdadera.
La caja representa el tramo entre \(Q_1\) y \(Q_3\). Si es más angosta, el 50% central está más concentrado.
3. Falsa.
El boxplot no muestra la media aritmética de manera directa; muestra mínimo, \(Q_1\), mediana, \(Q_3\) y máximo.
Ticket de salida
- ¿Qué parte del boxplot te ayuda más a comparar la dispersión del 50% central?
- Si un grupo tiene mediana más alta pero una caja mucho más ancha, ¿qué dos ideas podrías concluir?
- Escribe una conclusión breve y bien justificada para comparar dos boxplots.
- La caja, porque va desde \(Q_1\) hasta \(Q_3\) y representa el 50% central.
- Que su posición central es mayor, pero también que sus datos centrales están más dispersos.
- Una posible respuesta es: “El conjunto A tiene una mediana mayor, pero el conjunto B presenta una caja más angosta, por lo que sus datos centrales están más concentrados”.
- Comparar boxplots exige mirar mediana, caja, extremos y forma general.
- Una mediana mayor indica una posición central más alta, pero no basta por sí sola para describir todo el conjunto.
- La caja permite comparar la dispersión del 50% central.
- Los extremos ayudan a detectar asimetrías y posibles valores muy alejados.
- Las mejores conclusiones son las que están justificadas con evidencia del gráfico.
10. Taller integrador de posición y boxplot
Objetivo de la página
Integrar los aprendizajes sobre cuartiles, deciles, percentiles, resumen de cinco números y boxplot, para resolver, interpretar y justificar conclusiones en distintos contextos.
En estas páginas aprendimos a ubicar posiciones dentro de un conjunto de datos, resumir información clave y representar conjuntos mediante boxplots.
Ahora corresponde integrar esas ideas en situaciones donde no basta con calcular: también hay que interpretar, comparar y justificar conclusiones.
- Si los datos no están ordenados, ordénalos primero.
- Distingue qué te piden: cuartil, decil, percentil, resumen de cinco números o comparación con boxplot.
- Usa el lenguaje adecuado: mediana, 50% central, mayor dispersión, asimetría, posible valor extremo.
- No concluyas solo por intuición visual: apoya tus respuestas con valores o elementos concretos del gráfico.
- \(Q_1\) deja aproximadamente el 25\% de los datos en o bajo ese valor.
- \(Q_2\) coincide con la mediana y deja aproximadamente el 50\%.
- \(Q_3\) deja aproximadamente el 75\%.
- \(D_k\) deja aproximadamente el \(10k\%\).
- \(P_k\) deja aproximadamente el \(k\%\).
- El boxplot se construye con: \[ \text{mínimo},\ Q_1,\ \text{mediana},\ Q_3,\ \text{máximo} \]
Ejemplo modelo: integrar cálculo e interpretación
Considera el conjunto:
\[ 11,\ 13,\ 15,\ 18,\ 20,\ 22,\ 24,\ 26,\ 29 \]
Los datos ya están ordenados.
Mediana:
\[ Q_2=20 \]
Mitad inferior: \(\{11,13,15,18\}\)
Mitad superior: \(\{22,24,26,29\}\)
Cuartiles:
\[ Q_1=\frac{13+15}{2}=14 \]
\[ Q_3=\frac{24+26}{2}=25 \]
Resumen de cinco números:
\[ (11,\ 14,\ 20,\ 25,\ 29) \]
Interpretación: aproximadamente el 50% central de los datos se encuentra entre \(14\) y \(25\), y la posición central del conjunto está en \(20\).
Ejercicio 1: datos ordenados, cuartiles y resumen de cinco números
Considera el conjunto de datos:
\[ 14,\ 9,\ 17,\ 12,\ 11,\ 20,\ 16,\ 13,\ 15 \]
a) Ordénalo de menor a mayor.
b) Calcula \(Q_1\), \(Q_2\) y \(Q_3\).
c) Escribe el resumen de cinco números.
d) Interpreta el tramo central del conjunto.
a) Ordenamos los datos:
\[ 9,\ 11,\ 12,\ 13,\ 14,\ 15,\ 16,\ 17,\ 20 \]
b) Cuartiles
Como hay \(9\) datos, el valor central es el quinto:
\[ Q_2=14 \]
Mitad inferior: \(\{9,11,12,13\}\)
Mitad superior: \(\{15,16,17,20\}\)
\[ Q_1=\frac{11+12}{2}=11{,}5 \]
\[ Q_3=\frac{16+17}{2}=16{,}5 \]
c) Resumen de cinco números:
\[ (9,\ 11{,}5,\ 14,\ 16{,}5,\ 20) \]
d) Interpretación: el 50% central de los datos se encuentra entre \(11{,}5\) y \(16{,}5\), y la posición central del conjunto está en \(14\).
Ejercicio 2: lectura de cuartiles, deciles y percentiles desde una ojiva
La siguiente tabla resume una distribución agrupada con frecuencia acumulada total \(200\):
| Intervalo | Frecuencia | Frecuencia acumulada |
|---|---|---|
| \([300,400)\) | 30 | 30 |
| \([400,500)\) | 40 | 70 |
| \([500,600)\) | 50 | 120 |
| \([600,700)\) | 40 | 160 |
| \([700,800]\) | 40 | 200 |
a) Estima \(Q_1\).
b) Estima \(D_6\).
c) Estima \(P_{75}\).
d) Explica qué significa \(D_6\) en este contexto.
Como la frecuencia acumulada total es \(200\):
a) \(Q_1\)
\[ 25\%\text{ de }200=50 \]
El acumulado \(50\) cae entre \(30\) y \(70\), dentro del tramo \([400,500)\).
Como está justo a la mitad de ese tramo acumulado, una estimación razonable es:
\[ Q_1\approx 450 \]
b) \(D_6\)
\[ 60\%\text{ de }200=120 \]
En la ojiva, el acumulado \(120\) se alcanza en:
\[ D_6=600 \]
c) \(P_{75}\)
\[ 75\%\text{ de }200=150 \]
El acumulado \(150\) cae entre \(120\) y \(160\), dentro del tramo \([600,700)\).
La diferencia acumulada es \(40\), y \(150\) está \(30\) unidades por sobre \(120\), es decir, a \(\frac{30}{40}=0{,}75\) del tramo.
Entonces una estimación razonable es:
\[ P_{75}\approx 600+0{,}75\cdot 100=675 \]
d) Interpretación de \(D_6\): aproximadamente el 60\% de los datos queda en o bajo el valor \(600\).
Ejercicio 3: comparación de dos grupos con boxplot
Dos cursos rindieron la misma evaluación. Sus resúmenes de cinco números son:
| Curso | Resumen de cinco números |
|---|---|
| A | \((420,\ 480,\ 550,\ 620,\ 710)\) |
| B | \((460,\ 520,\ 560,\ 590,\ 640)\) |
a) ¿Cuál curso tiene mayor mediana?
b) ¿Cuál curso presenta mayor homogeneidad?
c) Escribe una conclusión estadística bien justificada.
a) Mediana
\[ 560>550 \]
Por lo tanto, el curso B tiene mayor mediana.
b) Homogeneidad
Comparamos la amplitud intercuartílica:
En A:
\[ 620-480=140 \]
En B:
\[ 590-520=70 \]
También comparamos el rango total:
En A:
\[ 710-420=290 \]
En B:
\[ 640-460=180 \]
Como tanto la caja como el rango son menores en B, el curso B presenta mayor homogeneidad.
c) Conclusión posible: el curso B muestra una posición central algo mayor y, además, resultados más concentrados que el curso A.
Ejercicio 4: análisis crítico de afirmaciones
Decide si cada afirmación es verdadera o falsa. Justifica.
- Si dos boxplots tienen la misma mediana, entonces necesariamente tienen la misma dispersión.
- Una caja más angosta indica mayor concentración del 50% central de los datos.
- Desde un boxplot siempre se puede conocer la media aritmética exacta.
- \(Q_2\), \(D_5\) y \(P_{50}\) representan la misma idea de posición.
1. Falsa.
La mediana informa sobre la posición central, pero la dispersión depende de la caja, de los extremos y de la forma general del conjunto.
2. Verdadera.
La caja representa el tramo entre \(Q_1\) y \(Q_3\). Si es más angosta, el 50% central está más concentrado.
3. Falsa.
El boxplot no muestra la media aritmética; muestra mínimo, \(Q_1\), mediana, \(Q_3\) y máximo.
4. Verdadera.
\(Q_2\), \(D_5\) y \(P_{50}\) corresponden al 50\% acumulado, por eso se relacionan con la mediana.
Ejercicio 5: decisión en contexto
Dos atletas registraron estos tiempos, en segundos, en cinco series de entrenamiento. En este contexto, menor tiempo es mejor.
| Atleta | Resumen de cinco números |
|---|---|
| X | \((28,\ 30,\ 32,\ 35,\ 45)\) |
| Y | \((31,\ 32,\ 33,\ 34,\ 36)\) |
Si el entrenador prioriza regularidad más que un tiempo mínimo aislado, ¿a quién conviene elegir? Justifica.
Conviene elegir al atleta Y.
Es cierto que X tiene una mediana un poco menor:
\[ 32<33 \]
pero la diferencia es pequeña.
En cambio, Y es mucho más regular:
Amplitud intercuartílica de X:
\[ 35-30=5 \]
Amplitud intercuartílica de Y:
\[ 34-32=2 \]
Además, el máximo de X es muy alto:
\[ 45 \]
lo que sugiere una serie mucho más lenta que las demás.
Como el criterio es priorizar la regularidad, la mejor elección es Y, porque sus tiempos están mucho más concentrados.
Ticket de salida
- ¿Qué relación existe entre \(Q_2\), \(D_5\) y \(P_{50}\)?
- ¿Qué parte del boxplot representa el 50% central de los datos?
- Escribe una conclusión breve y bien justificada para comparar dos conjuntos usando boxplots.
- Los tres representan la misma idea de posición: el 50\% acumulado del conjunto.
- La caja, que va desde \(Q_1\) hasta \(Q_3\).
- Una posible respuesta es: “El conjunto A tiene una mediana mayor, pero el conjunto B presenta una caja más angosta, por lo que sus datos centrales están más concentrados”.
- Las medidas de posición ayudan a ubicar valores dentro de un conjunto ordenado.
- El resumen de cinco números sintetiza la información clave para construir un boxplot.
- El boxplot permite comparar centro, dispersión, forma general y posibles valores extremos.
- Una buena conclusión estadística no solo dice qué ocurre: también explica por qué a partir de los datos o del gráfico.