Medidas de posición
8. Boxplot II [interpretación, asimetría, dispersión, posibles atípicos]
Objetivo de la página
Interpretar boxplots en contexto, comparando centro, dispersión, asimetría y posibles valores atípicos, para justificar conclusiones sobre distintos conjuntos de datos.
En la página anterior aprendimos a construir un boxplot a partir del resumen de cinco números.
Ahora nos centraremos en lo más importante: leerlo, compararlo y sacar conclusiones justificadas.
En un curso diferenciado no basta con identificar \(Q_1\), la mediana o \(Q_3\); también interesa explicar qué nos permite concluir el gráfico y qué no.
- La mediana permite ubicar una posición central del conjunto.
- La caja, desde \(Q_1\) hasta \(Q_3\), contiene el 50\% central de los datos.
- Una caja más ancha sugiere mayor dispersión en la zona central.
- Los tramos desde el mínimo hasta \(Q_1\) y desde \(Q_3\) hasta el máximo ayudan a observar cómo se extienden los extremos.
- Si un lado es mucho más largo que el otro, el gráfico puede sugerir asimetría.
- Si aparece un extremo muy separado del resto, puede haber un valor extremo o un posible atípico.
- ¿Dónde está la mediana?
- ¿La caja es ancha o angosta?
- ¿Los tramos izquierdo y derecho son parecidos o muy distintos?
- ¿Hay algún valor muy alejado del resto?
- ¿Qué conclusión tiene respaldo en el gráfico y cuál sería exagerada?
Un boxplot no muestra todos los datos uno por uno.
Por eso, desde un boxplot no siempre se puede afirmar cuántos datos exactos se repiten, cuál es la media o cómo son todos los valores intermedios.
El análisis debe apoyarse en lo que el gráfico realmente muestra: posición, dispersión y forma general.
Ejemplo 1: misma mediana, distinta dispersión
Dos grupos de puntajes tienen estos resúmenes de cinco números:
| Grupo | Resumen de cinco números |
|---|---|
| A | \((420,\ 500,\ 560,\ 610,\ 680)\) |
| B | \((420,\ 470,\ 560,\ 650,\ 680)\) |
Los dos grupos tienen la misma mediana:
\[ 560 \]
Pero sus cajas no tienen el mismo ancho.
En el grupo A, la amplitud intercuartílica es:
\[ 610-500=110 \]
En el grupo B, la amplitud intercuartílica es:
\[ 650-470=180 \]
Conclusión: aunque ambos grupos comparten la misma posición central, el grupo B presenta mayor dispersión en el 50\% central de sus datos.
Ejemplo 2: leer asimetría con cautela
Observa este resumen:
\[ (8,\ 10,\ 11,\ 13,\ 25) \]
El tramo derecho desde \(Q_3\) hasta el máximo mide:
\[ 25-13=12 \]
El tramo izquierdo desde el mínimo hasta \(Q_1\) mide:
\[ 10-8=2 \]
Además, la mediana está más cerca de \(Q_1\) que de \(Q_3\).
Interpretación razonable: el gráfico sugiere asimetría hacia la derecha, porque los valores altos se extienden mucho más.
El boxplot no prueba por sí solo una “regla absoluta” sobre la distribución, pero sí entrega una señal clara de que el lado derecho está más extendido.
Ejemplo 3: posible valor atípico
Considera ahora este resumen:
\[ (14,\ 15,\ 16,\ 17,\ 35) \]
La caja está muy concentrada entre \(15\) y \(17\), pero el máximo llega hasta \(35\).
Interpretación razonable: el gráfico sugiere que existe un valor alto muy alejado del resto.
En una lectura escolar, eso puede describirse como un posible atípico o como un valor extremo que conviene revisar.
Decir “posible atípico” es más riguroso que afirmar automáticamente “atípico” sin usar un criterio formal adicional.
Ejemplo 4: comparación en contexto
Dos cursos rindieron la misma evaluación. Sus boxplots se resumen así:
| Curso | Resumen de cinco números |
|---|---|
| 1°A | \((380,\ 470,\ 540,\ 610,\ 690)\) |
| 1°B | \((400,\ 520,\ 560,\ 590,\ 620)\) |
Análisis:
- La mediana de 1°B es mayor: \[ 560>540 \]
- La caja de 1°B es más angosta: \[ 590-520=70 \] mientras que en 1°A: \[ 610-470=140 \]
- Además, el rango total de 1°B también es menor: \[ 620-400=220 \] frente a \[ 690-380=310 \]
Conclusión mejor justificada: el curso 1°B no solo tiene un rendimiento central algo mayor, sino también resultados más concentrados.
Si una jefatura preguntara cuál curso muestra un desempeño más homogéneo, el boxplot respalda mejor la elección de 1°B, porque su caja y su rango total son menores.
| Señal en el boxplot | Lectura posible |
|---|---|
| Caja más ancha | Mayor dispersión en el 50% central |
| Caja más angosta | Mayor concentración en el 50% central |
| Tramo derecho mucho más largo | Posible asimetría hacia la derecha |
| Tramo izquierdo mucho más largo | Posible asimetría hacia la izquierda |
| Valor extremo muy alejado | Posible dato atípico o valor extremo |
Una respuesta débil dice solo: “el curso B es mejor”.
Una respuesta sólida dice, por ejemplo: “el curso B tiene una mediana mayor y una menor amplitud intercuartílica, por eso presenta puntajes centrales más altos y más concentrados”.
En estadística, concluir sin justificar no basta: hay que apoyar la afirmación en elementos concretos del gráfico.
Ejercicio 1
Un boxplot tiene resumen de cinco números:
\[ (10,\ 14,\ 16,\ 18,\ 22) \]
a) ¿Dónde está la posición central?
b) ¿Entre qué valores se encuentra el 50\% central?
c) ¿El gráfico sugiere gran o pequeña dispersión en esa zona central? Justifica con lo que sí se observa.
a) La posición central está en la mediana:
\[ 16 \]
b) El 50\% central se encuentra entre:
\[ Q_1=14 \qquad \text{y} \qquad Q_3=18 \]
c) La dispersión central no parece grande, porque la caja mide:
\[ 18-14=4 \]
Eso indica que la mitad central de los datos está relativamente concentrada en un tramo corto.
Ejercicio 2
Dos conjuntos tienen estos resúmenes:
| Conjunto | Resumen |
|---|---|
| A | \((5,\ 9,\ 12,\ 15,\ 18)\) |
| B | \((5,\ 7,\ 12,\ 17,\ 18)\) |
¿Cuál tiene mayor dispersión en el 50\% central? Explica.
El conjunto B.
En A, la amplitud intercuartílica es:
\[ 15-9=6 \]
En B, la amplitud intercuartílica es:
\[ 17-7=10 \]
Como la caja de B sería más ancha, el 50\% central está más disperso en ese conjunto.
Ejercicio 3
Un boxplot tiene resumen:
\[ (6,\ 8,\ 9,\ 11,\ 24) \]
¿Qué tipo de asimetría sugiere? ¿Qué valor del resumen ayuda más a notar esa situación?
Sugiere asimetría hacia la derecha.
La señal principal es que el tramo derecho es mucho mayor:
\[ 24-11=13 \]
mientras que el tramo izquierdo mide:
\[ 8-6=2 \]
El valor que más llama la atención es el máximo \(24\), porque está muy alejado respecto de \(Q_3\).
Ejercicio 4
Una estudiante afirma: “Como dos boxplots tienen la misma mediana, entonces sus distribuciones son prácticamente iguales”.
¿Estás de acuerdo? Justifica con un argumento estadístico.
No estoy de acuerdo.
Tener la misma mediana solo indica que comparten una posición central similar, pero aún pueden diferir en:
- la amplitud intercuartílica,
- el rango total,
- la asimetría,
- la presencia de valores extremos.
Por eso, dos boxplots con la misma mediana pueden representar conjuntos bastante distintos.
Ejercicio 5
Decide si cada afirmación es verdadera o falsa. Justifica.
- Una caja más angosta sugiere menor dispersión del 50\% central.
- Si el tramo derecho es mucho más largo que el izquierdo, el gráfico puede sugerir asimetría hacia la derecha.
- Desde un boxplot siempre se puede saber el valor exacto de la media.
1. Verdadera.
La caja representa el tramo entre \(Q_1\) y \(Q_3\). Si es más angosta, el 50\% central está más concentrado.
2. Verdadera.
Ese es uno de los indicios habituales de asimetría hacia la derecha.
3. Falsa.
El boxplot no entrega la media de manera directa; muestra mínimo, \(Q_1\), mediana, \(Q_3\) y máximo.
Ticket de salida
- ¿Qué parte del boxplot permite describir el 50\% central de los datos?
- ¿Qué señal puede sugerir asimetría hacia la derecha?
- Escribe una conclusión breve pero justificada a partir de esta frase: “El conjunto B tiene la misma mediana que A, pero una caja más ancha”.
- La caja, que va desde \(Q_1\) hasta \(Q_3\).
- Que el tramo derecho sea claramente más largo que el izquierdo, o que el máximo quede mucho más alejado de \(Q_3\).
- Una posible conclusión es: “Ambos conjuntos tienen una posición central similar, pero en B el 50\% central de los datos está más disperso, porque su caja es más ancha”.
- Interpretar un boxplot exige mirar mediana, caja y extremos.
- La caja muestra la dispersión del 50\% central.
- Los lados desiguales pueden sugerir asimetría.
- Un extremo muy alejado puede sugerir un posible atípico.
- Una buena conclusión estadística debe estar justificada con elementos del gráfico.
