Medidas de dispersión
1. Rango barianza desviacion en datos sueltos
Dispersión, varianza y desviación estándar
Objetivos
- Calcular el rango, la media, la varianza y la desviación estándar de un conjunto de datos.
- Distinguir entre varianza poblacional y varianza muestral.
- Interpretar la desviación estándar como una medida de alejamiento promedio respecto de la media.
Dispersión
La dispersión indica qué tan separados están los datos entre sí o qué tan alejados están respecto de la media.
Una forma simple de medir la dispersión es el rango:
\[ \text{Rango}=\text{dato mayor}-\text{dato menor} \]
Media, varianza y desviación estándar
Para un conjunto de datos \(x_1,x_2,\ldots,x_n\), la media se calcula como:
\[ \bar{x}=\frac{\sum x_i}{n} \]
Si los datos representan a toda la población, la varianza es:
\[ V(x)=\frac{\sum (\bar{x}-x_i)^2}{n} \]
Si los datos representan una muestra, la varianza es:
\[ V(x)=\frac{\sum (\bar{x}-x_i)^2}{n-1} \]
La desviación estándar se obtiene calculando la raíz cuadrada de la varianza:
\[ \sigma=\sqrt{V(x)} \]
Interpretación
La desviación estándar permite estimar, aproximadamente, cuánto se alejan los datos de la media.
Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos.
Ejemplo: estaturas
Se registraron las siguientes estaturas, en centímetros:
\[ 167,\ 175,\ 170,\ 180,\ 190,\ 150,\ 180,\ 160,\ 170 \]
Rango:
El dato mayor es \(190\) y el dato menor es \(150\). Entonces:
\[ \text{Rango}=190-150=40 \]
Media:
\[ \bar{x}=\frac{167+175+170+180+190+150+180+160+170}{9} \]
\[ \bar{x}=\frac{1542}{9}=171,3 \]
Varianza poblacional:
Como se considera el grupo completo, usamos:
\[ V(x)=\frac{\sum(\bar{x}-x_i)^2}{n} \]
| Dato \(x_i\) | \(\bar{x}-x_i\) | \((\bar{x}-x_i)^2\) |
|---|---|---|
| 167 | 4,3 | 18,49 |
| 175 | -3,7 | 13,69 |
| 170 | 1,3 | 1,69 |
| 180 | -8,7 | 75,69 |
| 190 | -18,7 | 349,69 |
| 150 | 21,3 | 453,69 |
| 180 | -8,7 | 75,69 |
| 160 | 11,3 | 127,69 |
| 170 | 1,3 | 1,69 |
Sumando los cuadrados:
\[ \sum(\bar{x}-x_i)^2 \approx 1118,01 \]
Entonces:
\[ V(x)=\frac{1118,01}{9}\approx 124,22 \]
Desviación estándar:
\[ \sigma=\sqrt{124,22}\approx 11,15 \]
Por lo tanto, las estaturas se alejan aproximadamente \(11,15\) cm de la media.
Atención con población y muestra
Si el grupo de datos corresponde a toda la población, se divide por \(n\).
Si el grupo de datos corresponde a una muestra, se divide por \(n-1\).
Ejercicios
Ejercicio A: edades
Calcula la desviación estándar del siguiente grupo de edades, considerando que corresponde a una población:
\[ 30,\ 35,\ 70,\ 50,\ 45,\ 30,\ 60,\ 85,\ 70 \]
Primero calculamos la media:
\[ \bar{x}=\frac{30+35+70+50+45+30+60+85+70}{9} \]
\[ \bar{x}=\frac{475}{9}\approx 52,78 \]
Luego calculamos la suma de los cuadrados de las diferencias respecto de la media:
\[ \sum(\bar{x}-x_i)^2\approx 3105,56 \]
Como es población, dividimos por \(n=9\):
\[ V(x)=\frac{3105,56}{9}\approx 345,06 \]
Finalmente, calculamos la desviación estándar:
\[ \sigma=\sqrt{345,06}\approx 18,58 \]
Respuesta: la desviación estándar es aproximadamente \(18,58\) años.
Ejercicio B: número de hijos
Calcula la desviación estándar del siguiente grupo de datos, considerando que corresponde a una población:
\[ 2,\ 0,\ 3,\ 3,\ 5,\ 2,\ 0,\ 1,\ 1,\ 2,\ 2,\ 3 \]
Primero calculamos la media:
\[ \bar{x}=\frac{2+0+3+3+5+2+0+1+1+2+2+3}{12} \]
\[ \bar{x}=\frac{24}{12}=2 \]
Ahora calculamos la suma de los cuadrados de las diferencias respecto de la media:
\[ (2-2)^2+(2-0)^2+(2-3)^2+(2-3)^2+(2-5)^2+(2-2)^2 \]
\[ +(2-0)^2+(2-1)^2+(2-1)^2+(2-2)^2+(2-2)^2+(2-3)^2 \]
\[ =0+4+1+1+9+0+4+1+1+0+0+1=22 \]
Como es población:
\[ V(x)=\frac{22}{12}\approx 1,83 \]
Finalmente:
\[ \sigma=\sqrt{1,83}\approx 1,35 \]
Respuesta: la desviación estándar es aproximadamente \(1,35\) hijos.
Ejercicio C: camiones por piso
Calcula la desviación estándar del siguiente grupo de datos, considerando que corresponde a una muestra:
\[ 7,\ 10,\ 12,\ 12,\ 6,\ 9 \]
Primero calculamos la media:
\[ \bar{x}=\frac{7+10+12+12+6+9}{6} \]
\[ \bar{x}=\frac{56}{6}\approx 9,33 \]
Calculamos la suma de los cuadrados de las diferencias:
\[ \sum(\bar{x}-x_i)^2\approx 31,33 \]
Como es muestra, dividimos por \(n-1\). En este caso, \(n=6\), por lo tanto \(n-1=5\):
\[ V(x)=\frac{31,33}{5}\approx 6,27 \]
Finalmente:
\[ \sigma=\sqrt{6,27}\approx 2,50 \]
Respuesta: la desviación estándar muestral es aproximadamente \(2,50\) camiones.