Medidas de posición
10. Taller integrador de posición y boxplot
Objetivo de la página
Integrar los aprendizajes sobre cuartiles, deciles, percentiles, resumen de cinco números y boxplot, para resolver, interpretar y justificar conclusiones en distintos contextos.
En estas páginas aprendimos a ubicar posiciones dentro de un conjunto de datos, resumir información clave y representar conjuntos mediante boxplots.
Ahora corresponde integrar esas ideas en situaciones donde no basta con calcular: también hay que interpretar, comparar y justificar conclusiones.
- Si los datos no están ordenados, ordénalos primero.
- Distingue qué te piden: cuartil, decil, percentil, resumen de cinco números o comparación con boxplot.
- Usa el lenguaje adecuado: mediana, 50% central, mayor dispersión, asimetría, posible valor extremo.
- No concluyas solo por intuición visual: apoya tus respuestas con valores o elementos concretos del gráfico.
- \(Q_1\) deja aproximadamente el 25\% de los datos en o bajo ese valor.
- \(Q_2\) coincide con la mediana y deja aproximadamente el 50\%.
- \(Q_3\) deja aproximadamente el 75\%.
- \(D_k\) deja aproximadamente el \(10k\%\).
- \(P_k\) deja aproximadamente el \(k\%\).
- El boxplot se construye con: \[ \text{mínimo},\ Q_1,\ \text{mediana},\ Q_3,\ \text{máximo} \]
Ejemplo modelo: integrar cálculo e interpretación
Considera el conjunto:
\[ 11,\ 13,\ 15,\ 18,\ 20,\ 22,\ 24,\ 26,\ 29 \]
Los datos ya están ordenados.
Mediana:
\[ Q_2=20 \]
Mitad inferior: \(\{11,13,15,18\}\)
Mitad superior: \(\{22,24,26,29\}\)
Cuartiles:
\[ Q_1=\frac{13+15}{2}=14 \]
\[ Q_3=\frac{24+26}{2}=25 \]
Resumen de cinco números:
\[ (11,\ 14,\ 20,\ 25,\ 29) \]
Interpretación: aproximadamente el 50% central de los datos se encuentra entre \(14\) y \(25\), y la posición central del conjunto está en \(20\).
Ejercicio 1: datos ordenados, cuartiles y resumen de cinco números
Considera el conjunto de datos:
\[ 14,\ 9,\ 17,\ 12,\ 11,\ 20,\ 16,\ 13,\ 15 \]
a) Ordénalo de menor a mayor.
b) Calcula \(Q_1\), \(Q_2\) y \(Q_3\).
c) Escribe el resumen de cinco números.
d) Interpreta el tramo central del conjunto.
a) Ordenamos los datos:
\[ 9,\ 11,\ 12,\ 13,\ 14,\ 15,\ 16,\ 17,\ 20 \]
b) Cuartiles
Como hay \(9\) datos, el valor central es el quinto:
\[ Q_2=14 \]
Mitad inferior: \(\{9,11,12,13\}\)
Mitad superior: \(\{15,16,17,20\}\)
\[ Q_1=\frac{11+12}{2}=11{,}5 \]
\[ Q_3=\frac{16+17}{2}=16{,}5 \]
c) Resumen de cinco números:
\[ (9,\ 11{,}5,\ 14,\ 16{,}5,\ 20) \]
d) Interpretación: el 50% central de los datos se encuentra entre \(11{,}5\) y \(16{,}5\), y la posición central del conjunto está en \(14\).
Ejercicio 2: lectura de cuartiles, deciles y percentiles desde una ojiva
La siguiente tabla resume una distribución agrupada con frecuencia acumulada total \(200\):
| Intervalo | Frecuencia | Frecuencia acumulada |
|---|---|---|
| \([300,400)\) | 30 | 30 |
| \([400,500)\) | 40 | 70 |
| \([500,600)\) | 50 | 120 |
| \([600,700)\) | 40 | 160 |
| \([700,800]\) | 40 | 200 |
a) Estima \(Q_1\).
b) Estima \(D_6\).
c) Estima \(P_{75}\).
d) Explica qué significa \(D_6\) en este contexto.
Como la frecuencia acumulada total es \(200\):
a) \(Q_1\)
\[ 25\%\text{ de }200=50 \]
El acumulado \(50\) cae entre \(30\) y \(70\), dentro del tramo \([400,500)\).
Como está justo a la mitad de ese tramo acumulado, una estimación razonable es:
\[ Q_1\approx 450 \]
b) \(D_6\)
\[ 60\%\text{ de }200=120 \]
En la ojiva, el acumulado \(120\) se alcanza en:
\[ D_6=600 \]
c) \(P_{75}\)
\[ 75\%\text{ de }200=150 \]
El acumulado \(150\) cae entre \(120\) y \(160\), dentro del tramo \([600,700)\).
La diferencia acumulada es \(40\), y \(150\) está \(30\) unidades por sobre \(120\), es decir, a \(\frac{30}{40}=0{,}75\) del tramo.
Entonces una estimación razonable es:
\[ P_{75}\approx 600+0{,}75\cdot 100=675 \]
d) Interpretación de \(D_6\): aproximadamente el 60\% de los datos queda en o bajo el valor \(600\).
Ejercicio 3: comparación de dos grupos con boxplot
Dos cursos rindieron la misma evaluación. Sus resúmenes de cinco números son:
| Curso | Resumen de cinco números |
|---|---|
| A | \((420,\ 480,\ 550,\ 620,\ 710)\) |
| B | \((460,\ 520,\ 560,\ 590,\ 640)\) |
a) ¿Cuál curso tiene mayor mediana?
b) ¿Cuál curso presenta mayor homogeneidad?
c) Escribe una conclusión estadística bien justificada.
a) Mediana
\[ 560>550 \]
Por lo tanto, el curso B tiene mayor mediana.
b) Homogeneidad
Comparamos la amplitud intercuartílica:
En A:
\[ 620-480=140 \]
En B:
\[ 590-520=70 \]
También comparamos el rango total:
En A:
\[ 710-420=290 \]
En B:
\[ 640-460=180 \]
Como tanto la caja como el rango son menores en B, el curso B presenta mayor homogeneidad.
c) Conclusión posible: el curso B muestra una posición central algo mayor y, además, resultados más concentrados que el curso A.
Ejercicio 4: análisis crítico de afirmaciones
Decide si cada afirmación es verdadera o falsa. Justifica.
- Si dos boxplots tienen la misma mediana, entonces necesariamente tienen la misma dispersión.
- Una caja más angosta indica mayor concentración del 50% central de los datos.
- Desde un boxplot siempre se puede conocer la media aritmética exacta.
- \(Q_2\), \(D_5\) y \(P_{50}\) representan la misma idea de posición.
1. Falsa.
La mediana informa sobre la posición central, pero la dispersión depende de la caja, de los extremos y de la forma general del conjunto.
2. Verdadera.
La caja representa el tramo entre \(Q_1\) y \(Q_3\). Si es más angosta, el 50% central está más concentrado.
3. Falsa.
El boxplot no muestra la media aritmética; muestra mínimo, \(Q_1\), mediana, \(Q_3\) y máximo.
4. Verdadera.
\(Q_2\), \(D_5\) y \(P_{50}\) corresponden al 50\% acumulado, por eso se relacionan con la mediana.
Ejercicio 5: decisión en contexto
Dos atletas registraron estos tiempos, en segundos, en cinco series de entrenamiento. En este contexto, menor tiempo es mejor.
| Atleta | Resumen de cinco números |
|---|---|
| X | \((28,\ 30,\ 32,\ 35,\ 45)\) |
| Y | \((31,\ 32,\ 33,\ 34,\ 36)\) |
Si el entrenador prioriza regularidad más que un tiempo mínimo aislado, ¿a quién conviene elegir? Justifica.
Conviene elegir al atleta Y.
Es cierto que X tiene una mediana un poco menor:
\[ 32<33 \]
pero la diferencia es pequeña.
En cambio, Y es mucho más regular:
Amplitud intercuartílica de X:
\[ 35-30=5 \]
Amplitud intercuartílica de Y:
\[ 34-32=2 \]
Además, el máximo de X es muy alto:
\[ 45 \]
lo que sugiere una serie mucho más lenta que las demás.
Como el criterio es priorizar la regularidad, la mejor elección es Y, porque sus tiempos están mucho más concentrados.
Ticket de salida
- ¿Qué relación existe entre \(Q_2\), \(D_5\) y \(P_{50}\)?
- ¿Qué parte del boxplot representa el 50% central de los datos?
- Escribe una conclusión breve y bien justificada para comparar dos conjuntos usando boxplots.
- Los tres representan la misma idea de posición: el 50\% acumulado del conjunto.
- La caja, que va desde \(Q_1\) hasta \(Q_3\).
- Una posible respuesta es: “El conjunto A tiene una mediana mayor, pero el conjunto B presenta una caja más angosta, por lo que sus datos centrales están más concentrados”.
- Las medidas de posición ayudan a ubicar valores dentro de un conjunto ordenado.
- El resumen de cinco números sintetiza la información clave para construir un boxplot.
- El boxplot permite comparar centro, dispersión, forma general y posibles valores extremos.
- Una buena conclusión estadística no solo dice qué ocurre: también explica por qué a partir de los datos o del gráfico.