Medidas de dispersión
| Sitio: | MATEMÁTICAS × Profe Arauco |
| Curso: | Probabilidades y Estadística Descriptiva e Inferencial |
| Libro: | Medidas de dispersión |
| Imprimido por: | Invitado |
| Día: | lunes, 25 de mayo de 2026, 15:20 |
1. Rango barianza desviacion en datos sueltos
Dispersión, varianza y desviación estándar
Objetivos
- Calcular el rango, la media, la varianza y la desviación estándar de un conjunto de datos.
- Distinguir entre varianza poblacional y varianza muestral.
- Interpretar la desviación estándar como una medida de alejamiento promedio respecto de la media.
Dispersión
La dispersión indica qué tan separados están los datos entre sí o qué tan alejados están respecto de la media.
Una forma simple de medir la dispersión es el rango:
\[ \text{Rango}=\text{dato mayor}-\text{dato menor} \]
Media, varianza y desviación estándar
Para un conjunto de datos \(x_1,x_2,\ldots,x_n\), la media se calcula como:
\[ \bar{x}=\frac{\sum x_i}{n} \]
Si los datos representan a toda la población, la varianza es:
\[ V(x)=\frac{\sum (\bar{x}-x_i)^2}{n} \]
Si los datos representan una muestra, la varianza es:
\[ V(x)=\frac{\sum (\bar{x}-x_i)^2}{n-1} \]
La desviación estándar se obtiene calculando la raíz cuadrada de la varianza:
\[ \sigma=\sqrt{V(x)} \]
Interpretación
La desviación estándar permite estimar, aproximadamente, cuánto se alejan los datos de la media.
Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos.
Ejemplo: estaturas
Se registraron las siguientes estaturas, en centímetros:
\[ 167,\ 175,\ 170,\ 180,\ 190,\ 150,\ 180,\ 160,\ 170 \]
Rango:
El dato mayor es \(190\) y el dato menor es \(150\). Entonces:
\[ \text{Rango}=190-150=40 \]
Media:
\[ \bar{x}=\frac{167+175+170+180+190+150+180+160+170}{9} \]
\[ \bar{x}=\frac{1542}{9}=171,3 \]
Varianza poblacional:
Como se considera el grupo completo, usamos:
\[ V(x)=\frac{\sum(\bar{x}-x_i)^2}{n} \]
| Dato \(x_i\) | \(\bar{x}-x_i\) | \((\bar{x}-x_i)^2\) |
|---|---|---|
| 167 | 4,3 | 18,49 |
| 175 | -3,7 | 13,69 |
| 170 | 1,3 | 1,69 |
| 180 | -8,7 | 75,69 |
| 190 | -18,7 | 349,69 |
| 150 | 21,3 | 453,69 |
| 180 | -8,7 | 75,69 |
| 160 | 11,3 | 127,69 |
| 170 | 1,3 | 1,69 |
Sumando los cuadrados:
\[ \sum(\bar{x}-x_i)^2 \approx 1118,01 \]
Entonces:
\[ V(x)=\frac{1118,01}{9}\approx 124,22 \]
Desviación estándar:
\[ \sigma=\sqrt{124,22}\approx 11,15 \]
Por lo tanto, las estaturas se alejan aproximadamente \(11,15\) cm de la media.
Atención con población y muestra
Si el grupo de datos corresponde a toda la población, se divide por \(n\).
Si el grupo de datos corresponde a una muestra, se divide por \(n-1\).
Ejercicios
Ejercicio A: edades
Calcula la desviación estándar del siguiente grupo de edades, considerando que corresponde a una población:
\[ 30,\ 35,\ 70,\ 50,\ 45,\ 30,\ 60,\ 85,\ 70 \]
Primero calculamos la media:
\[ \bar{x}=\frac{30+35+70+50+45+30+60+85+70}{9} \]
\[ \bar{x}=\frac{475}{9}\approx 52,78 \]
Luego calculamos la suma de los cuadrados de las diferencias respecto de la media:
\[ \sum(\bar{x}-x_i)^2\approx 3105,56 \]
Como es población, dividimos por \(n=9\):
\[ V(x)=\frac{3105,56}{9}\approx 345,06 \]
Finalmente, calculamos la desviación estándar:
\[ \sigma=\sqrt{345,06}\approx 18,58 \]
Respuesta: la desviación estándar es aproximadamente \(18,58\) años.
Ejercicio B: número de hijos
Calcula la desviación estándar del siguiente grupo de datos, considerando que corresponde a una población:
\[ 2,\ 0,\ 3,\ 3,\ 5,\ 2,\ 0,\ 1,\ 1,\ 2,\ 2,\ 3 \]
Primero calculamos la media:
\[ \bar{x}=\frac{2+0+3+3+5+2+0+1+1+2+2+3}{12} \]
\[ \bar{x}=\frac{24}{12}=2 \]
Ahora calculamos la suma de los cuadrados de las diferencias respecto de la media:
\[ (2-2)^2+(2-0)^2+(2-3)^2+(2-3)^2+(2-5)^2+(2-2)^2 \]
\[ +(2-0)^2+(2-1)^2+(2-1)^2+(2-2)^2+(2-2)^2+(2-3)^2 \]
\[ =0+4+1+1+9+0+4+1+1+0+0+1=22 \]
Como es población:
\[ V(x)=\frac{22}{12}\approx 1,83 \]
Finalmente:
\[ \sigma=\sqrt{1,83}\approx 1,35 \]
Respuesta: la desviación estándar es aproximadamente \(1,35\) hijos.
Ejercicio C: camiones por piso
Calcula la desviación estándar del siguiente grupo de datos, considerando que corresponde a una muestra:
\[ 7,\ 10,\ 12,\ 12,\ 6,\ 9 \]
Primero calculamos la media:
\[ \bar{x}=\frac{7+10+12+12+6+9}{6} \]
\[ \bar{x}=\frac{56}{6}\approx 9,33 \]
Calculamos la suma de los cuadrados de las diferencias:
\[ \sum(\bar{x}-x_i)^2\approx 31,33 \]
Como es muestra, dividimos por \(n-1\). En este caso, \(n=6\), por lo tanto \(n-1=5\):
\[ V(x)=\frac{31,33}{5}\approx 6,27 \]
Finalmente:
\[ \sigma=\sqrt{6,27}\approx 2,50 \]
Respuesta: la desviación estándar muestral es aproximadamente \(2,50\) camiones.
2. Varianza desv agrup por intervalos
Varianza y desviación estándar en datos agrupados por intervalos
Objetivo
- Calcular e interpretar la varianza y la desviación estándar en datos agrupados por intervalos, usando la marca de clase como representante de cada intervalo.
- Identificar intervalos, frecuencias y marcas de clase.
- Calcular la media para datos agrupados por intervalos.
- Calcular varianza y desviación estándar en datos agrupados.
- Interpretar la dispersión de los datos respecto de la media.
Datos agrupados por intervalos
Cuando hay muchos datos, estos se pueden organizar en intervalos. En ese caso, no conocemos cada dato exacto, sino cuántos datos hay dentro de cada intervalo.
Para realizar cálculos como media, varianza y desviación estándar, usamos la marca de clase de cada intervalo.
Marca de clase
La marca de clase es el punto medio de un intervalo.
La marca de clase representa aproximadamente a todos los datos que están dentro de ese intervalo.
Ejemplo inicial: marcas de clase
Observa los siguientes intervalos:
| Intervalo | Marca de clase \(x_i\) |
|---|---|
| \([10,20[\) | \(\dfrac{10+20}{2}=15\) |
| \([20,30[\) | \(\dfrac{20+30}{2}=25\) |
| \([30,40[\) | \(\dfrac{30+40}{2}=35\) |
Media en datos agrupados
Para datos agrupados por intervalos, la media se calcula usando las marcas de clase y sus frecuencias.
Donde:
- \(x_i\) es la marca de clase.
- \(f_i\) es la frecuencia del intervalo.
- \(\sum f_i\) es el total de datos.
Varianza en datos agrupados
La varianza mide qué tan alejados están los datos respecto de la media.
En esta página usaremos esta versión dividiendo por el total de datos \(\sum f_i\).
Desviación estándar
La desviación estándar se obtiene calculando la raíz cuadrada de la varianza.
Idea clave
En datos agrupados por intervalos, no se usa cada dato exacto. Se usa la marca de clase \(x_i\) como valor representativo de cada intervalo.
Ejemplo 1: cálculo completo
La siguiente tabla muestra los puntajes obtenidos por un grupo de estudiantes en una evaluación:
| Intervalo de puntajes | Frecuencia \(f_i\) | Marca de clase \(x_i\) | \(f_i\cdot x_i\) |
|---|---|---|---|
| \([10,20[\) | \(2\) | \(15\) | \(30\) |
| \([20,30[\) | \(5\) | \(25\) | \(125\) |
| \([30,40[\) | \(8\) | \(35\) | \(280\) |
| \([40,50[\) | \(5\) | \(45\) | \(225\) |
Primero calculamos el total de datos:
\(\sum f_i=2+5+8+5=20\)
Luego calculamos la suma de los productos \(f_i\cdot x_i\):
\(\sum f_i\cdot x_i=30+125+280+225=660\)
Ahora calculamos la media:
\(\bar{x}=\dfrac{660}{20}=33\)
La media aproximada es \(33\) puntos.
Ejemplo 1: cálculo de la varianza
Usamos la media \(\bar{x}=33\) y completamos la tabla:
| \(x_i\) | \(f_i\) | \(x_i-\bar{x}\) | \((x_i-\bar{x})^2\) | \(f_i\cdot (x_i-\bar{x})^2\) |
|---|---|---|---|---|
| \(15\) | \(2\) | \(15-33=-18\) | \(324\) | \(648\) |
| \(25\) | \(5\) | \(25-33=-8\) | \(64\) | \(320\) |
| \(35\) | \(8\) | \(35-33=2\) | \(4\) | \(32\) |
| \(45\) | \(5\) | \(45-33=12\) | \(144\) | \(720\) |
Sumamos la última columna:
\(\sum f_i\cdot (x_i-\bar{x})^2=648+320+32+720=1720\)
Calculamos la varianza:
\(s^2=\dfrac{1720}{20}=86\)
Calculamos la desviación estándar:
\(s=\sqrt{86}\approx 9{,}27\)
La varianza es \(86\) y la desviación estándar es aproximadamente \(9{,}27\) puntos.
Interpretación del resultado
La media aproximada del grupo es \(33\) puntos.
La desviación estándar aproximada es \(9{,}27\) puntos, lo que significa que los puntajes suelen alejarse alrededor de \(9{,}27\) puntos respecto de la media.
Error frecuente
No se debe calcular la varianza usando directamente los intervalos completos.
Primero se debe calcular la marca de clase de cada intervalo y luego usar esas marcas como representantes de los datos.
Procedimiento resumido
- Calcular la marca de clase de cada intervalo.
- Multiplicar cada marca de clase por su frecuencia.
- Calcular la media con \(\bar{x}=\dfrac{\sum f_i\cdot x_i}{\sum f_i}\).
- Calcular \(x_i-\bar{x}\) para cada intervalo.
- Elevar cada diferencia al cuadrado.
- Multiplicar cada cuadrado por su frecuencia.
- Calcular la varianza con \(s^2=\dfrac{\sum f_i\cdot (x_i-\bar{x})^2}{\sum f_i}\).
- Calcular la desviación estándar con \(s=\sqrt{s^2}\).
Ejemplo 2: tabla más breve
La siguiente tabla muestra tiempos, en minutos, que demora un grupo de estudiantes en resolver una actividad:
| Intervalo | \(f_i\) | \(x_i\) | \(f_i\cdot x_i\) |
|---|---|---|---|
| \([0,10[\) | \(4\) | \(5\) | \(20\) |
| \([10,20[\) | \(6\) | \(15\) | \(90\) |
| \([20,30[\) | \(5\) | \(25\) | \(125\) |
| \([30,40[\) | \(5\) | \(35\) | \(175\) |
\(\sum f_i=20\)
\(\sum f_i\cdot x_i=410\)
\(\bar{x}=\dfrac{410}{20}=20{,}5\)
Ahora completamos la parte necesaria para la varianza:
| \(x_i\) | \(f_i\) | \((x_i-\bar{x})^2\) | \(f_i\cdot (x_i-\bar{x})^2\) |
|---|---|---|---|
| \(5\) | \(4\) | \(240{,}25\) | \(961\) |
| \(15\) | \(6\) | \(30{,}25\) | \(181{,}5\) |
| \(25\) | \(5\) | \(20{,}25\) | \(101{,}25\) |
| \(35\) | \(5\) | \(210{,}25\) | \(1051{,}25\) |
\(\sum f_i\cdot (x_i-\bar{x})^2=2295\)
\(s^2=\dfrac{2295}{20}=114{,}75\)
\(s=\sqrt{114{,}75}\approx 10{,}71\)
La varianza es \(114{,}75\) y la desviación estándar es aproximadamente \(10{,}71\) minutos.
¿Qué significa que la desviación estándar sea grande?
Una desviación estándar grande indica que los datos están más dispersos respecto de la media.
Una desviación estándar pequeña indica que los datos están más concentrados cerca de la media.
Actividad 1
Completa las marcas de clase de la siguiente tabla:
| Intervalo | Frecuencia | Marca de clase |
|---|---|---|
| \([0,20[\) | \(3\) | _____ |
| \([20,40[\) | \(7\) | _____ |
| \([40,60[\) | \(5\) | _____ |
Calculamos cada marca de clase usando el punto medio del intervalo:
\([0,20[\): \(x_i=\dfrac{0+20}{2}=10\)
\([20,40[\): \(x_i=\dfrac{20+40}{2}=30\)
\([40,60[\): \(x_i=\dfrac{40+60}{2}=50\)
Las marcas de clase son \(10\), \(30\) y \(50\).
Actividad 2
Calcula la media para la siguiente tabla:
| Intervalo | \(f_i\) | \(x_i\) |
|---|---|---|
| \([0,10[\) | \(2\) | \(5\) |
| \([10,20[\) | \(6\) | \(15\) |
| \([20,30[\) | \(2\) | \(25\) |
Calculamos el total de datos:
\(\sum f_i=2+6+2=10\)
Calculamos la suma de los productos \(f_i\cdot x_i\):
\(\sum f_i\cdot x_i=2\cdot 5+6\cdot 15+2\cdot 25=10+90+50=150\)
Calculamos la media:
\(\bar{x}=\dfrac{150}{10}=15\)
La media es \(15\).
Actividad 3
Con la media \(\bar{x}=15\), calcula la varianza y la desviación estándar de la tabla anterior.
Usamos \(s^2=\dfrac{\sum f_i\cdot (x_i-\bar{x})^2}{\sum f_i}\).
Para \(x_i=5\): \((5-15)^2=100\), entonces \(2\cdot 100=200\).
Para \(x_i=15\): \((15-15)^2=0\), entonces \(6\cdot 0=0\).
Para \(x_i=25\): \((25-15)^2=100\), entonces \(2\cdot 100=200\).
\(\sum f_i\cdot (x_i-\bar{x})^2=200+0+200=400\)
\(s^2=\dfrac{400}{10}=40\)
\(s=\sqrt{40}\approx 6{,}32\)
La varianza es \(40\) y la desviación estándar es aproximadamente \(6{,}32\).
Actividad 4
Una distribución tiene media \(50\) y la siguiente tabla:
| \(x_i\) | \(f_i\) |
|---|---|
| \(30\) | \(4\) |
| \(50\) | \(8\) |
| \(70\) | \(4\) |
Calcula la varianza y la desviación estándar.
Usamos la media \(\bar{x}=50\).
Para \(x_i=30\): \((30-50)^2=400\), entonces \(4\cdot 400=1600\).
Para \(x_i=50\): \((50-50)^2=0\), entonces \(8\cdot 0=0\).
Para \(x_i=70\): \((70-50)^2=400\), entonces \(4\cdot 400=1600\).
\(\sum f_i=4+8+4=16\)
\(\sum f_i\cdot (x_i-\bar{x})^2=1600+0+1600=3200\)
\(s^2=\dfrac{3200}{16}=200\)
\(s=\sqrt{200}\approx 14{,}14\)
La varianza es \(200\) y la desviación estándar es aproximadamente \(14{,}14\).
Resumen final
| Concepto | Fórmula | Uso |
|---|---|---|
| Marca de clase | \(x_i=\dfrac{L_i+L_s}{2}\) | Representa cada intervalo. |
| Media | \(\bar{x}=\dfrac{\sum f_i\cdot x_i}{\sum f_i}\) | Calcula el promedio aproximado. |
| Varianza | \(s^2=\dfrac{\sum f_i\cdot (x_i-\bar{x})^2}{\sum f_i}\) | Mide la dispersión cuadrática. |
| Desviación estándar | \(s=\sqrt{s^2}\) | Mide la dispersión en la misma unidad de los datos. |
3. Coeficiente de variacion
Coeficiente de variación
Objetivo
- Comprender e interpretar el coeficiente de variación como una medida que permite comparar la dispersión relativa de distintos grupos de datos.
- Calcular el coeficiente de variación usando media y desviación estándar.
- Comparar la variabilidad de dos conjuntos de datos.
- Interpretar el resultado porcentual en contextos reales.
¿Por qué necesitamos otra medida?
Ya sabemos que la varianza y la desviación estándar permiten medir cuánto se alejan los datos respecto de la media.
Sin embargo, a veces no basta con mirar solo la desviación estándar, porque dos grupos pueden tener medias muy distintas.
El coeficiente de variación permite comparar la dispersión de grupos de datos considerando el tamaño de su media.
Idea clave
El coeficiente de variación responde a la pregunta:
¿Qué tan grande es la desviación estándar en relación con la media?
Fórmula del coeficiente de variación
El coeficiente de variación se calcula así:
Donde:
- \(CV\) es el coeficiente de variación.
- \(s\) es la desviación estándar.
- \(\bar{x}\) es la media aritmética.
Interpretación
El coeficiente de variación se expresa como porcentaje.
- Un \(CV\) menor indica que los datos son más homogéneos o menos dispersos en relación con su media.
- Un \(CV\) mayor indica que los datos son más variables o más dispersos en relación con su media.
Ejemplo 1: cálculo directo
Un conjunto de datos tiene media \(\bar{x}=50\) y desviación estándar \(s=5\).
Calculamos:
\(CV=\dfrac{5}{50}\cdot 100\%\)
\(CV=0{,}1\cdot 100\%\)
\(CV=10\%\)
Esto significa que la desviación estándar representa el \(10\%\) de la media.
Ejemplo 2: comparación de dos cursos
Se comparan los puntajes de dos cursos en una prueba:
| Curso | Media | Desviación estándar |
|---|---|---|
| Curso A | \(60\) | \(6\) |
| Curso B | \(80\) | \(8\) |
Calculamos el coeficiente de variación de cada curso:
Curso A:
\(CV=\dfrac{6}{60}\cdot 100\%=10\%\)
Curso B:
\(CV=\dfrac{8}{80}\cdot 100\%=10\%\)
Aunque el Curso B tiene mayor desviación estándar, ambos cursos tienen la misma variabilidad relativa: \(10\%\).
¿Cuándo conviene usar el coeficiente de variación?
Conviene usarlo cuando se quieren comparar grupos con medias diferentes.
Por ejemplo, sirve para comparar:
- puntajes de dos cursos distintos,
- sueldos de dos empresas,
- tiempos de entrenamiento de dos grupos deportivos,
- precios de productos de distinto valor promedio.
Cuidado
El coeficiente de variación no se interpreta en unidades como puntos, pesos, centímetros o segundos.
Se interpreta como porcentaje, porque compara la desviación estándar con la media.
Además, para calcularlo se requiere que la media sea distinta de cero, ya que aparece en el denominador de la fórmula.
Ejemplo 3: decidir qué grupo es más variable
| Grupo | Media | Desviación estándar |
|---|---|---|
| Grupo 1 | \(20\) | \(4\) |
| Grupo 2 | \(50\) | \(5\) |
Grupo 1:
\(CV=\dfrac{4}{20}\cdot 100\%=20\%\)
Grupo 2:
\(CV=\dfrac{5}{50}\cdot 100\%=10\%\)
El Grupo 1 es más variable, porque su coeficiente de variación es mayor.
Resumen
| Concepto | Significado |
|---|---|
| Media | Valor promedio de los datos. |
| Desviación estándar | Mide cuánto se alejan los datos de la media. |
| Coeficiente de variación | Mide la dispersión relativa respecto de la media. |
Actividad 1
Un grupo de datos tiene media \(40\) y desviación estándar \(8\). Calcula el coeficiente de variación.
Usamos la fórmula:
\(CV=\dfrac{s}{\bar{x}}\cdot 100\%\)
Reemplazamos \(s=8\) y \(\bar{x}=40\):
\(CV=\dfrac{8}{40}\cdot 100\%\)
\(CV=0{,}2\cdot 100\%\)
\(CV=20\%\)
El coeficiente de variación es \(20\%\).
Actividad 2
Una muestra tiene media \(120\) y desviación estándar \(18\). Calcula el coeficiente de variación.
Usamos la fórmula:
\(CV=\dfrac{s}{\bar{x}}\cdot 100\%\)
Reemplazamos \(s=18\) y \(\bar{x}=120\):
\(CV=\dfrac{18}{120}\cdot 100\%\)
\(CV=0{,}15\cdot 100\%\)
\(CV=15\%\)
El coeficiente de variación es \(15\%\).
Actividad 3
Se comparan dos grupos:
| Grupo | Media | Desviación estándar |
|---|---|---|
| A | \(30\) | \(3\) |
| B | \(80\) | \(12\) |
¿Cuál grupo presenta mayor variabilidad relativa?
Calculamos el coeficiente de variación de cada grupo.
Grupo A:
\(CV=\dfrac{3}{30}\cdot 100\%=10\%\)
Grupo B:
\(CV=\dfrac{12}{80}\cdot 100\%=15\%\)
Como \(15\%>10\%\), el grupo B tiene mayor dispersión relativa.
El grupo B presenta mayor variabilidad relativa.
Actividad 4
Dos estudiantes tienen los siguientes resultados en distintas evaluaciones:
| Estudiante | Promedio | Desviación estándar |
|---|---|---|
| Estudiante 1 | \(6{,}0\) | \(0{,}6\) |
| Estudiante 2 | \(5{,}0\) | \(0{,}75\) |
¿Cuál estudiante tiene resultados más regulares?
Calculamos el coeficiente de variación de cada estudiante.
Estudiante 1:
\(CV=\dfrac{0{,}6}{6{,}0}\cdot 100\%=10\%\)
Estudiante 2:
\(CV=\dfrac{0{,}75}{5{,}0}\cdot 100\%=15\%\)
El estudiante con menor coeficiente de variación presenta resultados más regulares.
El estudiante 1 tiene resultados más regulares, porque su coeficiente de variación es menor.
Conclusión
El coeficiente de variación permite comparar la dispersión de grupos distintos usando un porcentaje.
Mientras menor sea el \(CV\), más homogéneos son los datos respecto de su media.