Estadistica
9. Introducción intuitiva al modelo normal
Introducción intuitiva al modelo normal
En la página anterior organizamos datos con tablas, histogramas y gráficos poligonales. Ahora daremos un paso más: reconocer una forma de distribución que aparece con mucha frecuencia en estadística, la distribución normal.
Esta distribución también se conoce como curva normal o campana de Gauss. No se trata solo de una curva bonita: es un modelo que ayuda a describir muchas situaciones reales en las que los datos se agrupan cerca de un valor central y los valores muy alejados de ese centro aparecen con menos frecuencia.
Objetivo de la página
- Reconocer de manera intuitiva la forma de una distribución normal.
- Interpretar el centro de una distribución.
- Comprender la idea de dispersión en una curva normal.
- Relacionar histogramas y gráficos poligonales con una forma aproximadamente acampanada.
Al finalizar esta página deberías poder:
- Identificar si una distribución se parece o no a una normal.
- Describir el centro y la dispersión de un conjunto de datos.
- Comparar dos distribuciones según su forma, su centro y su dispersión.
De manera intuitiva, una distribución normal se caracteriza por:
- Tener una forma acampanada.
- Ser aproximadamente simétrica respecto de un valor central.
- Tener mayor concentración de datos cerca del centro.
- Tener menos datos en los extremos.
Para describirla se usan dos ideas importantes:
- Centro: suele representarse por la media, \(\mu\).
- Dispersión: indica qué tan separados están los datos del centro; suele representarse por \(\sigma\).
De manera cualitativa:
- Si la dispersión es pequeña, la curva es más angosta y alta.
- Si la dispersión es grande, la curva es más ancha y baja.
En una distribución normal, lo más habitual es encontrar valores cercanos al centro. Los valores muy pequeños o muy grandes son posibles, pero menos frecuentes.
Normal no significa “correcto”, “ideal” o “bueno”. En estadística, solo describe un tipo de forma que puede tener una distribución de datos.
Resumen visual e interpretativo
| Aspecto | Qué se observa | Cómo se interpreta |
|---|---|---|
| Forma | Campana aproximadamente simétrica | Los datos se distribuyen de manera equilibrada alrededor del centro |
| Centro | Punto medio de la distribución | Valor alrededor del cual se concentran los datos |
| Dispersión pequeña | Curva angosta y alta | Los datos están más agrupados |
| Dispersión grande | Curva ancha y baja | Los datos están más repartidos |
| Extremos | Poca frecuencia | Los valores muy alejados del centro son menos comunes |
Ejemplo guiado 1: reconocer una forma aproximadamente normal
Se agruparon las estaturas de un grupo de estudiantes en los siguientes intervalos:
| Intervalo de estatura (cm) | Frecuencia | Marca de clase |
|---|---|---|
| 140 a 150 | 2 | 145 |
| 150 a 160 | 5 | 155 |
| 160 a 170 | 9 | 165 |
| 170 a 180 | 5 | 175 |
| 180 a 190 | 2 | 185 |
Histograma aproximado
Gráfico poligonal aproximado
La distribución es aproximadamente simétrica y presenta una mayor concentración en el centro, cerca de 165 cm a 175 cm.
Por eso decimos que se parece a una distribución normal.
Ejemplo guiado 2: mismo centro, distinta dispersión
Las siguientes dos distribuciones tienen centro cercano a 50, pero distinta dispersión.
Distribución A
Distribución B
En ambas distribuciones el centro está cerca de 50.
Sin embargo, la distribución A es más angosta, por lo que tiene menor dispersión.
La distribución B es más ancha, por lo que tiene mayor dispersión.
Dos distribuciones pueden tener el mismo centro y, aun así, verse distintas si una tiene los datos más agrupados y la otra más extendidos. Por eso, para describir bien una distribución no basta con mirar solo el valor central.
La estatura de personas de una misma edad, algunos errores de medición, ciertos puntajes y muchas variables biológicas suelen presentar una forma aproximadamente normal. Esto permite resumir y comparar información de manera más clara.
Ejercicios
Ejercicio 1
Explica con tus palabras qué significa que una distribución tenga forma aproximadamente normal.
Significa que los datos se concentran cerca de un valor central, que la distribución tiene una forma similar a una campana y que los valores muy alejados del centro aparecen con menor frecuencia. Además, suele verse aproximadamente simétrica.
Ejercicio 2
Se observa una distribución de puntajes con frecuencias agrupadas así:
| Intervalo | Frecuencia |
|---|---|
| 40 a 50 | 2 |
| 50 a 60 | 5 |
| 60 a 70 | 8 |
| 70 a 80 | 5 |
| 80 a 90 | 2 |
Indica si esta distribución se parece a una normal y justifica.
Sí, se parece a una distribución normal, porque tiene una forma aproximadamente simétrica y la mayor frecuencia está en el centro, en el intervalo 60 a 70. Hacia ambos extremos las frecuencias disminuyen de manera parecida.
Ejercicio 3
Una distribución A y una distribución B tienen el mismo centro. La distribución A es más angosta y la B es más ancha.
¿Cuál tiene mayor dispersión? Explica.
La distribución B tiene mayor dispersión, porque sus datos están más repartidos alrededor del centro. Una curva más ancha representa una mayor separación respecto del valor central.
Ejercicio 4
En una distribución aproximadamente normal, ¿por qué los valores extremos aparecen con menos frecuencia que los cercanos al centro?
Porque en una distribución normal la mayor concentración de datos está alrededor del centro. A medida que uno se aleja de ese centro, los casos se vuelven menos comunes, por eso los extremos aparecen con menor frecuencia.
Ejercicio 5
Se sabe que los tiempos de reacción de un grupo de estudiantes presentan una forma aproximadamente normal, con centro cerca de 30 centésimas de segundo.
¿Qué significa, en contexto, que el centro esté cerca de 30?
Significa que los tiempos de reacción del grupo tienden a agruparse alrededor de 30 centésimas de segundo. Ese valor representa el comportamiento central o típico de la distribución.
Ejercicio 6
Compara estas dos situaciones:
- Curso A: puntajes centrados cerca de 65, con poca dispersión.
- Curso B: puntajes centrados cerca de 65, con mucha dispersión.
Escribe una diferencia importante entre ambas distribuciones.
Aunque ambos cursos tienen un centro parecido, en el Curso A los puntajes están más agrupados cerca de 65, mientras que en el Curso B están más repartidos. Por eso el Curso B muestra mayor variabilidad en sus resultados.
Ejercicio 7
Un estudiante dice: “Si una distribución es normal, entonces todos los datos deben ser casi iguales”.
¿Es correcta esa afirmación? Justifica.
No, esa afirmación es incorrecta.
En una distribución normal los datos tienden a concentrarse cerca del centro, pero no son todos iguales. Hay variación: algunos valores están cerca del centro y otros más alejados, aunque estos últimos aparecen con menor frecuencia.
Ejercicio 8
Observa la siguiente distribución agrupada:
| Intervalo | Frecuencia |
|---|---|
| 10 a 20 | 1 |
| 20 a 30 | 3 |
| 30 a 40 | 7 |
| 40 a 50 | 10 |
| 50 a 60 | 6 |
| 60 a 70 | 2 |
- Indica en qué intervalo está el centro aproximado.
- ¿La distribución parece simétrica?
- ¿Se parece mucho o poco a una normal? Explica.
a) El centro aproximado está en el intervalo 40 a 50, porque allí se concentra la mayor frecuencia.
b) No es completamente simétrica.
c) Se parece solo de manera parcial a una normal, porque tiene una concentración central clara, pero las frecuencias a ambos lados no disminuyen de forma bastante equilibrada.
Ejercicios tipo PAES
PAES 1
¿Cuál de las siguientes características corresponde mejor a una distribución aproximadamente normal?
- Tiene una sola barra y no presenta dispersión.
- Es aproximadamente simétrica y concentra los datos cerca del centro.
- Todos los valores tienen la misma frecuencia.
- Los extremos son los valores más frecuentes.
La característica correcta es la b.
Alternativa correcta: b
PAES 2
Dos distribuciones tienen el mismo centro. Si una de ellas presenta mayor dispersión, entonces su curva será:
- Más ancha y más baja.
- Más angosta y más alta.
- Igual a la otra.
- Siempre asimétrica.
Con mayor dispersión, la curva se ve más extendida: más ancha y más baja.
Alternativa correcta: a
PAES 3
En una distribución aproximadamente normal, la mayor parte de los datos suele encontrarse:
- En los extremos.
- Lejos del centro.
- Cerca del centro.
- Solo en el lado izquierdo.
En una distribución normal los datos se concentran cerca del centro.
Alternativa correcta: c
PAES 4
¿Cuál de las siguientes afirmaciones es verdadera?
- “Normal” significa que los datos son perfectos.
- Una distribución normal no tiene centro.
- La dispersión indica qué tan separados están los datos respecto del centro.
- En una distribución normal los extremos son más frecuentes que el centro.
La afirmación verdadera es la c.
Alternativa correcta: c
Cierre
En esta página introdujimos de manera intuitiva el modelo normal. Vimos que su forma es aproximadamente acampanada, que tiene un centro y que su dispersión puede cambiar sin que necesariamente cambie ese centro.
Esto será clave para la siguiente página, donde podremos interpretar con más precisión qué significa que un valor esté cerca o lejos del centro de una distribución normal.
- Una distribución normal tiene forma aproximadamente acampanada.
- El centro indica dónde se agrupan los datos.
- La dispersión muestra qué tan extendidos están los datos.
- No toda distribución simétrica es perfectamente normal, pero muchas pueden parecerse bastante.