Medidas de posición

8. Boxplot II [interpretación, asimetría, dispersión, posibles atípicos]

Objetivo de la página

Interpretar boxplots en contexto, comparando centro, dispersión, asimetría y posibles valores atípicos, para justificar conclusiones sobre distintos conjuntos de datos.

🤓 Conexión con la página anterior

En la página anterior aprendimos a construir un boxplot a partir del resumen de cinco números.

Ahora nos centraremos en lo más importante: leerlo, compararlo y sacar conclusiones justificadas.

En un curso diferenciado no basta con identificar \(Q_1\), la mediana o \(Q_3\); también interesa explicar qué nos permite concluir el gráfico y qué no.

📐 Qué información entrega un boxplot
  • La mediana permite ubicar una posición central del conjunto.
  • La caja, desde \(Q_1\) hasta \(Q_3\), contiene el 50\% central de los datos.
  • Una caja más ancha sugiere mayor dispersión en la zona central.
  • Los tramos desde el mínimo hasta \(Q_1\) y desde \(Q_3\) hasta el máximo ayudan a observar cómo se extienden los extremos.
  • Si un lado es mucho más largo que el otro, el gráfico puede sugerir asimetría.
  • Si aparece un extremo muy separado del resto, puede haber un valor extremo o un posible atípico.
💡 Preguntas útiles al mirar un boxplot
  1. ¿Dónde está la mediana?
  2. ¿La caja es ancha o angosta?
  3. ¿Los tramos izquierdo y derecho son parecidos o muy distintos?
  4. ¿Hay algún valor muy alejado del resto?
  5. ¿Qué conclusión tiene respaldo en el gráfico y cuál sería exagerada?
⚠️ Lo que un boxplot no permite afirmar por sí solo

Un boxplot no muestra todos los datos uno por uno.

Por eso, desde un boxplot no siempre se puede afirmar cuántos datos exactos se repiten, cuál es la media o cómo son todos los valores intermedios.

El análisis debe apoyarse en lo que el gráfico realmente muestra: posición, dispersión y forma general.

Ejemplo 1: misma mediana, distinta dispersión

Dos grupos de puntajes tienen estos resúmenes de cinco números:

Grupo Resumen de cinco números
A \((420,\ 500,\ 560,\ 610,\ 680)\)
B \((420,\ 470,\ 560,\ 650,\ 680)\)

Los dos grupos tienen la misma mediana:

\[ 560 \]

Pero sus cajas no tienen el mismo ancho.

En el grupo A, la amplitud intercuartílica es:

\[ 610-500=110 \]

En el grupo B, la amplitud intercuartílica es:

\[ 650-470=180 \]

Conclusión: aunque ambos grupos comparten la misma posición central, el grupo B presenta mayor dispersión en el 50\% central de sus datos.

Ejemplo 2: leer asimetría con cautela

Observa este resumen:

\[ (8,\ 10,\ 11,\ 13,\ 25) \]

El tramo derecho desde \(Q_3\) hasta el máximo mide:

\[ 25-13=12 \]

El tramo izquierdo desde el mínimo hasta \(Q_1\) mide:

\[ 10-8=2 \]

Además, la mediana está más cerca de \(Q_1\) que de \(Q_3\).

Interpretación razonable: el gráfico sugiere asimetría hacia la derecha, porque los valores altos se extienden mucho más.

🤓 Lectura crítica

El boxplot no prueba por sí solo una “regla absoluta” sobre la distribución, pero sí entrega una señal clara de que el lado derecho está más extendido.

Ejemplo 3: posible valor atípico

Considera ahora este resumen:

\[ (14,\ 15,\ 16,\ 17,\ 35) \]

La caja está muy concentrada entre \(15\) y \(17\), pero el máximo llega hasta \(35\).

Interpretación razonable: el gráfico sugiere que existe un valor alto muy alejado del resto.

En una lectura escolar, eso puede describirse como un posible atípico o como un valor extremo que conviene revisar.

⚠️ Importante

Decir “posible atípico” es más riguroso que afirmar automáticamente “atípico” sin usar un criterio formal adicional.

Ejemplo 4: comparación en contexto

Dos cursos rindieron la misma evaluación. Sus boxplots se resumen así:

Curso Resumen de cinco números
1°A \((380,\ 470,\ 540,\ 610,\ 690)\)
1°B \((400,\ 520,\ 560,\ 590,\ 620)\)

Análisis:

  • La mediana de 1°B es mayor: \[ 560>540 \]
  • La caja de 1°B es más angosta: \[ 590-520=70 \] mientras que en 1°A: \[ 610-470=140 \]
  • Además, el rango total de 1°B también es menor: \[ 620-400=220 \] frente a \[ 690-380=310 \]

Conclusión mejor justificada: el curso 1°B no solo tiene un rendimiento central algo mayor, sino también resultados más concentrados.

🌍 Decisión en contexto

Si una jefatura preguntara cuál curso muestra un desempeño más homogéneo, el boxplot respalda mejor la elección de 1°B, porque su caja y su rango total son menores.

📐 Resumen de interpretación
Señal en el boxplot Lectura posible
Caja más ancha Mayor dispersión en el 50% central
Caja más angosta Mayor concentración en el 50% central
Tramo derecho mucho más largo Posible asimetría hacia la derecha
Tramo izquierdo mucho más largo Posible asimetría hacia la izquierda
Valor extremo muy alejado Posible dato atípico o valor extremo
🤓 Qué respuesta sería débil y cuál sería sólida

Una respuesta débil dice solo: “el curso B es mejor”.

Una respuesta sólida dice, por ejemplo: “el curso B tiene una mediana mayor y una menor amplitud intercuartílica, por eso presenta puntajes centrales más altos y más concentrados”.

En estadística, concluir sin justificar no basta: hay que apoyar la afirmación en elementos concretos del gráfico.

Ejercicio 1

Un boxplot tiene resumen de cinco números:

\[ (10,\ 14,\ 16,\ 18,\ 22) \]

a) ¿Dónde está la posición central?

b) ¿Entre qué valores se encuentra el 50\% central?

c) ¿El gráfico sugiere gran o pequeña dispersión en esa zona central? Justifica con lo que sí se observa.

Ejercicio 2

Dos conjuntos tienen estos resúmenes:

Conjunto Resumen
A \((5,\ 9,\ 12,\ 15,\ 18)\)
B \((5,\ 7,\ 12,\ 17,\ 18)\)

¿Cuál tiene mayor dispersión en el 50\% central? Explica.

Ejercicio 3

Un boxplot tiene resumen:

\[ (6,\ 8,\ 9,\ 11,\ 24) \]

¿Qué tipo de asimetría sugiere? ¿Qué valor del resumen ayuda más a notar esa situación?

Ejercicio 4

Una estudiante afirma: “Como dos boxplots tienen la misma mediana, entonces sus distribuciones son prácticamente iguales”.

¿Estás de acuerdo? Justifica con un argumento estadístico.

Ejercicio 5

Decide si cada afirmación es verdadera o falsa. Justifica.

  1. Una caja más angosta sugiere menor dispersión del 50\% central.
  2. Si el tramo derecho es mucho más largo que el izquierdo, el gráfico puede sugerir asimetría hacia la derecha.
  3. Desde un boxplot siempre se puede saber el valor exacto de la media.

Ticket de salida

  1. ¿Qué parte del boxplot permite describir el 50\% central de los datos?
  2. ¿Qué señal puede sugerir asimetría hacia la derecha?
  3. Escribe una conclusión breve pero justificada a partir de esta frase: “El conjunto B tiene la misma mediana que A, pero una caja más ancha”.
💡 Ideas clave para cerrar
  • Interpretar un boxplot exige mirar mediana, caja y extremos.
  • La caja muestra la dispersión del 50\% central.
  • Los lados desiguales pueden sugerir asimetría.
  • Un extremo muy alejado puede sugerir un posible atípico.
  • Una buena conclusión estadística debe estar justificada con elementos del gráfico.