Medidas de posición
9. Comparación de conjuntos de datos con boxplot [decisiones y conclusiones] (PAES M1)
Objetivo de la página
Comparar conjuntos de datos mediante boxplots, justificando conclusiones sobre posición central, dispersión, asimetría y posibles valores extremos en distintos contextos.
En la página anterior aprendimos a interpretar un boxplot individual.
Ahora daremos un paso más: comparar dos o más boxplots para tomar decisiones y sostener conclusiones con evidencia gráfica.
Este tipo de lectura es muy útil cuando se quiere comparar cursos, grupos, rendimientos, tiempos, puntajes o resultados de distintas experiencias.
- La mediana: permite comparar la posición central de los conjuntos.
- La caja: muestra el 50% central de los datos; una caja más ancha indica mayor dispersión en esa zona.
- Los extremos: ayudan a comparar la extensión total de los datos.
- La forma general: puede sugerir asimetría hacia la izquierda o hacia la derecha.
- Valores muy alejados: pueden sugerir un posible dato extremo o atípico.
No basta con decir “un grupo es mejor” o “un grupo está más disperso”.
La comparación debe apoyarse en elementos concretos del gráfico, por ejemplo:
- “la mediana de A es mayor que la de B”,
- “la caja de B es más angosta que la de A”,
- “el tramo derecho de C es mucho más largo que el izquierdo”.
Una mediana más alta no implica automáticamente que todo el conjunto sea “mejor”.
También puede haber mayor dispersión, más desigualdad interna o valores extremos que cambien la lectura del contexto.
Ejemplo 1: misma mediana, distinta dispersión
Dos grupos tienen estos resúmenes de cinco números:
| Grupo | Resumen de cinco números |
|---|---|
| A | \((420,\ 500,\ 560,\ 610,\ 680)\) |
| B | \((420,\ 470,\ 560,\ 650,\ 680)\) |
Ambos grupos tienen la misma mediana:
\[ 560 \]
Pero la amplitud intercuartílica no es la misma.
Grupo A:
\[ 610-500=110 \]
Grupo B:
\[ 650-470=180 \]
Conclusión: ambos grupos tienen la misma posición central, pero el grupo B presenta mayor dispersión en el 50% central de sus datos.
Ejemplo 2: mejor posición central y mayor homogeneidad
En una evaluación, dos cursos obtuvieron estos resúmenes:
| Curso | Resumen de cinco números |
|---|---|
| 1°A | \((380,\ 470,\ 540,\ 610,\ 690)\) |
| 1°B | \((400,\ 520,\ 560,\ 590,\ 620)\) |
Análisis de la mediana:
\[ 560>540 \]
Análisis de la dispersión central:
En 1°A:
\[ 610-470=140 \]
En 1°B:
\[ 590-520=70 \]
Análisis del rango total:
En 1°A:
\[ 690-380=310 \]
En 1°B:
\[ 620-400=220 \]
Conclusión: el curso 1°B presenta una mediana algo mayor y, además, resultados más homogéneos, porque su caja y su rango total son menores.
Ejemplo 3: misma dispersión central, distinta forma
Observa estos dos conjuntos:
| Conjunto | Resumen de cinco números |
|---|---|
| C | \((8,\ 10,\ 12,\ 14,\ 16)\) |
| D | \((4,\ 10,\ 12,\ 14,\ 25)\) |
Ambos tienen la misma caja:
\[ Q_1=10,\qquad \text{mediana}=12,\qquad Q_3=14 \]
Por eso, el 50% central se comporta de manera parecida en ambos conjuntos.
Sin embargo, los extremos son muy distintos:
- en C, los extremos quedan cerca de la caja,
- en D, el máximo \(25\) queda mucho más alejado y el mínimo \(4\) también se separa más del centro.
Conclusión: dos boxplots pueden compartir la misma zona central y, aun así, diferir bastante en sus extremos y en la forma general del conjunto.
Ejemplo 4: decisión en contexto
Una profesora quiere escoger entre dos cursos para representar al colegio en una actividad donde importa que el rendimiento sea alto y parejo.
Los resúmenes de cinco números son:
| Curso | Resumen de cinco números |
|---|---|
| X | \((410,\ 450,\ 590,\ 640,\ 700)\) |
| Y | \((500,\ 540,\ 580,\ 610,\ 640)\) |
La mediana de X es levemente mayor:
\[ 590>580 \]
Pero la dispersión de X es mucho mayor:
\[ 640-450=190 \]
Mientras que en Y:
\[ 610-540=70 \]
Decisión mejor argumentada: si lo prioritario es un desempeño más parejo, conviene escoger el curso Y. Aunque X tiene una mediana algo mayor, Y muestra mucha más homogeneidad.
Sí se puede concluir desde boxplots que un grupo tiene mayor mediana, mayor dispersión central o extremos más alejados.
No se puede concluir directamente cuántos estudiantes exactos obtuvieron cierto puntaje, cuál es la media aritmética o cómo son todos los datos internos del conjunto.
| Situación observada | Forma adecuada de justificar |
|---|---|
| Mediana mayor | “La posición central del conjunto A es mayor que la de B, porque su mediana está más a la derecha.” |
| Caja más ancha | “El 50% central de A está más disperso que el de B, porque su caja es más ancha.” |
| Extremo muy alejado | “A presenta un valor extremo alto que se separa claramente del resto del conjunto.” |
| Tramo derecho más largo | “El gráfico sugiere asimetría hacia la derecha, porque los valores altos se extienden más.” |
Ejercicio 1
Dos conjuntos tienen estos resúmenes:
| Conjunto | Resumen |
|---|---|
| A | \((5,\ 8,\ 11,\ 14,\ 17)\) |
| B | \((5,\ 6,\ 11,\ 16,\ 17)\) |
¿Cuál tiene mayor dispersión en el 50% central? Justifica.
El conjunto B.
En A, la amplitud intercuartílica es:
\[ 14-8=6 \]
En B, la amplitud intercuartílica es:
\[ 16-6=10 \]
Como la caja de B sería más ancha, el 50% central de sus datos está más disperso.
Ejercicio 2
Un curso A tiene resumen \((400,\ 480,\ 550,\ 620,\ 700)\) y un curso B tiene resumen \((430,\ 520,\ 560,\ 590,\ 630)\).
¿Cuál curso muestra resultados más homogéneos? Justifica con al menos dos argumentos.
El curso B muestra resultados más homogéneos.
Primer argumento: su amplitud intercuartílica es menor:
\[ 590-520=70 \]
mientras que en A es:
\[ 620-480=140 \]
Segundo argumento: su rango total también es menor:
\[ 630-430=200 \]
mientras que en A es:
\[ 700-400=300 \]
Por eso, B presenta datos más concentrados tanto en la parte central como en el conjunto total.
Ejercicio 3
Dos boxplots tienen la misma mediana, pero uno de ellos tiene un máximo mucho más alejado de \(Q_3\).
¿Qué conclusión razonable puede extraerse?
Puede concluirse que, aunque ambos conjuntos tienen una posición central similar, uno de ellos presenta mayor extensión hacia los valores altos.
Eso puede sugerir asimetría hacia la derecha o la presencia de un valor extremo alto.
Ejercicio 4
Una estudiante dice: “Como el boxplot del grupo A tiene la mediana más alta, entonces todos los estudiantes de A obtuvieron mejores resultados que los de B”.
¿La conclusión es correcta? Explica.
No, esa conclusión no es correcta.
Que A tenga una mediana más alta solo indica que su posición central es mayor, pero no significa que todos sus datos sean mayores que todos los de B.
Los boxplots pueden solaparse y seguir mostrando medianas distintas.
Ejercicio 5
Decide si cada afirmación es verdadera o falsa. Justifica.
- Si dos boxplots tienen la misma mediana, entonces necesariamente tienen la misma dispersión.
- Una caja más angosta sugiere mayor concentración en el 50% central.
- Desde un boxplot siempre se puede conocer el valor exacto de la media.
1. Falsa.
La mediana informa sobre la posición central, no sobre toda la dispersión. Dos conjuntos pueden compartir mediana y tener cajas muy distintas.
2. Verdadera.
La caja representa el tramo entre \(Q_1\) y \(Q_3\). Si es más angosta, el 50% central está más concentrado.
3. Falsa.
El boxplot no muestra la media aritmética de manera directa; muestra mínimo, \(Q_1\), mediana, \(Q_3\) y máximo.
Ticket de salida
- ¿Qué parte del boxplot te ayuda más a comparar la dispersión del 50% central?
- Si un grupo tiene mediana más alta pero una caja mucho más ancha, ¿qué dos ideas podrías concluir?
- Escribe una conclusión breve y bien justificada para comparar dos boxplots.
- La caja, porque va desde \(Q_1\) hasta \(Q_3\) y representa el 50% central.
- Que su posición central es mayor, pero también que sus datos centrales están más dispersos.
- Una posible respuesta es: “El conjunto A tiene una mediana mayor, pero el conjunto B presenta una caja más angosta, por lo que sus datos centrales están más concentrados”.
- Comparar boxplots exige mirar mediana, caja, extremos y forma general.
- Una mediana mayor indica una posición central más alta, pero no basta por sí sola para describir todo el conjunto.
- La caja permite comparar la dispersión del 50% central.
- Los extremos ayudan a detectar asimetrías y posibles valores muy alejados.
- Las mejores conclusiones son las que están justificadas con evidencia del gráfico.
