Medidas de dispersión

Sitio: MATEMÁTICAS × Profe Arauco
Curso: Probabilidades y Estadística Descriptiva e Inferencial
Libro: Medidas de dispersión
Imprimido por: Invitado
Día: lunes, 25 de mayo de 2026, 15:20

1. Rango barianza desviacion en datos sueltos

Dispersión, varianza y desviación estándar

Objetivos

  • Calcular el rango, la media, la varianza y la desviación estándar de un conjunto de datos.
  • Distinguir entre varianza poblacional y varianza muestral.
  • Interpretar la desviación estándar como una medida de alejamiento promedio respecto de la media.

Dispersión

La dispersión indica qué tan separados están los datos entre sí o qué tan alejados están respecto de la media.

Una forma simple de medir la dispersión es el rango:

\[ \text{Rango}=\text{dato mayor}-\text{dato menor} \]

Media, varianza y desviación estándar

Para un conjunto de datos \(x_1,x_2,\ldots,x_n\), la media se calcula como:

\[ \bar{x}=\frac{\sum x_i}{n} \]

Si los datos representan a toda la población, la varianza es:

\[ V(x)=\frac{\sum (\bar{x}-x_i)^2}{n} \]

Si los datos representan una muestra, la varianza es:

\[ V(x)=\frac{\sum (\bar{x}-x_i)^2}{n-1} \]

La desviación estándar se obtiene calculando la raíz cuadrada de la varianza:

\[ \sigma=\sqrt{V(x)} \]

Interpretación

La desviación estándar permite estimar, aproximadamente, cuánto se alejan los datos de la media.

Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos.

Ejemplo: estaturas

Se registraron las siguientes estaturas, en centímetros:

\[ 167,\ 175,\ 170,\ 180,\ 190,\ 150,\ 180,\ 160,\ 170 \]

Rango:

El dato mayor es \(190\) y el dato menor es \(150\). Entonces:

\[ \text{Rango}=190-150=40 \]

Media:

\[ \bar{x}=\frac{167+175+170+180+190+150+180+160+170}{9} \]

\[ \bar{x}=\frac{1542}{9}=171,3 \]

Varianza poblacional:

Como se considera el grupo completo, usamos:

\[ V(x)=\frac{\sum(\bar{x}-x_i)^2}{n} \]

Dato \(x_i\) \(\bar{x}-x_i\) \((\bar{x}-x_i)^2\)
167 4,3 18,49
175 -3,7 13,69
170 1,3 1,69
180 -8,7 75,69
190 -18,7 349,69
150 21,3 453,69
180 -8,7 75,69
160 11,3 127,69
170 1,3 1,69

Sumando los cuadrados:

\[ \sum(\bar{x}-x_i)^2 \approx 1118,01 \]

Entonces:

\[ V(x)=\frac{1118,01}{9}\approx 124,22 \]

Desviación estándar:

\[ \sigma=\sqrt{124,22}\approx 11,15 \]

Por lo tanto, las estaturas se alejan aproximadamente \(11,15\) cm de la media.

Atención con población y muestra

Si el grupo de datos corresponde a toda la población, se divide por \(n\).

Si el grupo de datos corresponde a una muestra, se divide por \(n-1\).

Ejercicios

Ejercicio A: edades

Calcula la desviación estándar del siguiente grupo de edades, considerando que corresponde a una población:

\[ 30,\ 35,\ 70,\ 50,\ 45,\ 30,\ 60,\ 85,\ 70 \]

Ejercicio B: número de hijos

Calcula la desviación estándar del siguiente grupo de datos, considerando que corresponde a una población:

\[ 2,\ 0,\ 3,\ 3,\ 5,\ 2,\ 0,\ 1,\ 1,\ 2,\ 2,\ 3 \]

Ejercicio C: camiones por piso

Calcula la desviación estándar del siguiente grupo de datos, considerando que corresponde a una muestra:

\[ 7,\ 10,\ 12,\ 12,\ 6,\ 9 \]

2. Varianza desv agrup por intervalos

Varianza y desviación estándar en datos agrupados por intervalos

Objetivo

  • Calcular e interpretar la varianza y la desviación estándar en datos agrupados por intervalos, usando la marca de clase como representante de cada intervalo.
    • Identificar intervalos, frecuencias y marcas de clase.
    • Calcular la media para datos agrupados por intervalos.
    • Calcular varianza y desviación estándar en datos agrupados.
    • Interpretar la dispersión de los datos respecto de la media.

Datos agrupados por intervalos

Cuando hay muchos datos, estos se pueden organizar en intervalos. En ese caso, no conocemos cada dato exacto, sino cuántos datos hay dentro de cada intervalo.

Para realizar cálculos como media, varianza y desviación estándar, usamos la marca de clase de cada intervalo.

Marca de clase

La marca de clase es el punto medio de un intervalo.

\(x_i=\dfrac{\text{límite inferior}+\text{límite superior}}{2}\)

La marca de clase representa aproximadamente a todos los datos que están dentro de ese intervalo.

Ejemplo inicial: marcas de clase

Observa los siguientes intervalos:

Intervalo Marca de clase \(x_i\)
\([10,20[\) \(\dfrac{10+20}{2}=15\)
\([20,30[\) \(\dfrac{20+30}{2}=25\)
\([30,40[\) \(\dfrac{30+40}{2}=35\)

Media en datos agrupados

Para datos agrupados por intervalos, la media se calcula usando las marcas de clase y sus frecuencias.

\(\bar{x}=\dfrac{\sum f_i\cdot x_i}{\sum f_i}\)

Donde:

  • \(x_i\) es la marca de clase.
  • \(f_i\) es la frecuencia del intervalo.
  • \(\sum f_i\) es el total de datos.

Varianza en datos agrupados

La varianza mide qué tan alejados están los datos respecto de la media.

\(s^2=\dfrac{\sum f_i\cdot (x_i-\bar{x})^2}{\sum f_i}\)

En esta página usaremos esta versión dividiendo por el total de datos \(\sum f_i\).

Desviación estándar

La desviación estándar se obtiene calculando la raíz cuadrada de la varianza.

\(s=\sqrt{s^2}\)

Idea clave

En datos agrupados por intervalos, no se usa cada dato exacto. Se usa la marca de clase \(x_i\) como valor representativo de cada intervalo.

Ejemplo 1: cálculo completo

La siguiente tabla muestra los puntajes obtenidos por un grupo de estudiantes en una evaluación:

Intervalo de puntajes Frecuencia \(f_i\) Marca de clase \(x_i\) \(f_i\cdot x_i\)
\([10,20[\) \(2\) \(15\) \(30\)
\([20,30[\) \(5\) \(25\) \(125\)
\([30,40[\) \(8\) \(35\) \(280\)
\([40,50[\) \(5\) \(45\) \(225\)

Primero calculamos el total de datos:

\(\sum f_i=2+5+8+5=20\)

Luego calculamos la suma de los productos \(f_i\cdot x_i\):

\(\sum f_i\cdot x_i=30+125+280+225=660\)

Ahora calculamos la media:

\(\bar{x}=\dfrac{660}{20}=33\)

La media aproximada es \(33\) puntos.

Ejemplo 1: cálculo de la varianza

Usamos la media \(\bar{x}=33\) y completamos la tabla:

\(x_i\) \(f_i\) \(x_i-\bar{x}\) \((x_i-\bar{x})^2\) \(f_i\cdot (x_i-\bar{x})^2\)
\(15\) \(2\) \(15-33=-18\) \(324\) \(648\)
\(25\) \(5\) \(25-33=-8\) \(64\) \(320\)
\(35\) \(8\) \(35-33=2\) \(4\) \(32\)
\(45\) \(5\) \(45-33=12\) \(144\) \(720\)

Sumamos la última columna:

\(\sum f_i\cdot (x_i-\bar{x})^2=648+320+32+720=1720\)

Calculamos la varianza:

\(s^2=\dfrac{1720}{20}=86\)

Calculamos la desviación estándar:

\(s=\sqrt{86}\approx 9{,}27\)

La varianza es \(86\) y la desviación estándar es aproximadamente \(9{,}27\) puntos.

Interpretación del resultado

La media aproximada del grupo es \(33\) puntos.

La desviación estándar aproximada es \(9{,}27\) puntos, lo que significa que los puntajes suelen alejarse alrededor de \(9{,}27\) puntos respecto de la media.

Error frecuente

No se debe calcular la varianza usando directamente los intervalos completos.

Primero se debe calcular la marca de clase de cada intervalo y luego usar esas marcas como representantes de los datos.

Procedimiento resumido

  1. Calcular la marca de clase de cada intervalo.
  2. Multiplicar cada marca de clase por su frecuencia.
  3. Calcular la media con \(\bar{x}=\dfrac{\sum f_i\cdot x_i}{\sum f_i}\).
  4. Calcular \(x_i-\bar{x}\) para cada intervalo.
  5. Elevar cada diferencia al cuadrado.
  6. Multiplicar cada cuadrado por su frecuencia.
  7. Calcular la varianza con \(s^2=\dfrac{\sum f_i\cdot (x_i-\bar{x})^2}{\sum f_i}\).
  8. Calcular la desviación estándar con \(s=\sqrt{s^2}\).

Ejemplo 2: tabla más breve

La siguiente tabla muestra tiempos, en minutos, que demora un grupo de estudiantes en resolver una actividad:

Intervalo \(f_i\) \(x_i\) \(f_i\cdot x_i\)
\([0,10[\) \(4\) \(5\) \(20\)
\([10,20[\) \(6\) \(15\) \(90\)
\([20,30[\) \(5\) \(25\) \(125\)
\([30,40[\) \(5\) \(35\) \(175\)

\(\sum f_i=20\)

\(\sum f_i\cdot x_i=410\)

\(\bar{x}=\dfrac{410}{20}=20{,}5\)

Ahora completamos la parte necesaria para la varianza:

\(x_i\) \(f_i\) \((x_i-\bar{x})^2\) \(f_i\cdot (x_i-\bar{x})^2\)
\(5\) \(4\) \(240{,}25\) \(961\)
\(15\) \(6\) \(30{,}25\) \(181{,}5\)
\(25\) \(5\) \(20{,}25\) \(101{,}25\)
\(35\) \(5\) \(210{,}25\) \(1051{,}25\)

\(\sum f_i\cdot (x_i-\bar{x})^2=2295\)

\(s^2=\dfrac{2295}{20}=114{,}75\)

\(s=\sqrt{114{,}75}\approx 10{,}71\)

La varianza es \(114{,}75\) y la desviación estándar es aproximadamente \(10{,}71\) minutos.

¿Qué significa que la desviación estándar sea grande?

Una desviación estándar grande indica que los datos están más dispersos respecto de la media.

Una desviación estándar pequeña indica que los datos están más concentrados cerca de la media.

Actividad 1

Completa las marcas de clase de la siguiente tabla:

Intervalo Frecuencia Marca de clase
\([0,20[\) \(3\) _____
\([20,40[\) \(7\) _____
\([40,60[\) \(5\) _____

Actividad 2

Calcula la media para la siguiente tabla:

Intervalo \(f_i\) \(x_i\)
\([0,10[\) \(2\) \(5\)
\([10,20[\) \(6\) \(15\)
\([20,30[\) \(2\) \(25\)

Actividad 3

Con la media \(\bar{x}=15\), calcula la varianza y la desviación estándar de la tabla anterior.

Actividad 4

Una distribución tiene media \(50\) y la siguiente tabla:

\(x_i\) \(f_i\)
\(30\) \(4\)
\(50\) \(8\)
\(70\) \(4\)

Calcula la varianza y la desviación estándar.

Resumen final

Concepto Fórmula Uso
Marca de clase \(x_i=\dfrac{L_i+L_s}{2}\) Representa cada intervalo.
Media \(\bar{x}=\dfrac{\sum f_i\cdot x_i}{\sum f_i}\) Calcula el promedio aproximado.
Varianza \(s^2=\dfrac{\sum f_i\cdot (x_i-\bar{x})^2}{\sum f_i}\) Mide la dispersión cuadrática.
Desviación estándar \(s=\sqrt{s^2}\) Mide la dispersión en la misma unidad de los datos.

3. Coeficiente de variacion

Coeficiente de variación

Objetivo

  • Comprender e interpretar el coeficiente de variación como una medida que permite comparar la dispersión relativa de distintos grupos de datos.
    • Calcular el coeficiente de variación usando media y desviación estándar.
    • Comparar la variabilidad de dos conjuntos de datos.
    • Interpretar el resultado porcentual en contextos reales.

¿Por qué necesitamos otra medida?

Ya sabemos que la varianza y la desviación estándar permiten medir cuánto se alejan los datos respecto de la media.

Sin embargo, a veces no basta con mirar solo la desviación estándar, porque dos grupos pueden tener medias muy distintas.

El coeficiente de variación permite comparar la dispersión de grupos de datos considerando el tamaño de su media.

Idea clave

El coeficiente de variación responde a la pregunta:

¿Qué tan grande es la desviación estándar en relación con la media?

Fórmula del coeficiente de variación

El coeficiente de variación se calcula así:

\(CV=\dfrac{s}{\bar{x}}\cdot 100\%\)

Donde:

  • \(CV\) es el coeficiente de variación.
  • \(s\) es la desviación estándar.
  • \(\bar{x}\) es la media aritmética.

Interpretación

El coeficiente de variación se expresa como porcentaje.

  • Un \(CV\) menor indica que los datos son más homogéneos o menos dispersos en relación con su media.
  • Un \(CV\) mayor indica que los datos son más variables o más dispersos en relación con su media.

Ejemplo 1: cálculo directo

Un conjunto de datos tiene media \(\bar{x}=50\) y desviación estándar \(s=5\).

Calculamos:

\(CV=\dfrac{5}{50}\cdot 100\%\)

\(CV=0{,}1\cdot 100\%\)

\(CV=10\%\)

Esto significa que la desviación estándar representa el \(10\%\) de la media.

Ejemplo 2: comparación de dos cursos

Se comparan los puntajes de dos cursos en una prueba:

Curso Media Desviación estándar
Curso A \(60\) \(6\)
Curso B \(80\) \(8\)

Calculamos el coeficiente de variación de cada curso:

Curso A:

\(CV=\dfrac{6}{60}\cdot 100\%=10\%\)

Curso B:

\(CV=\dfrac{8}{80}\cdot 100\%=10\%\)

Aunque el Curso B tiene mayor desviación estándar, ambos cursos tienen la misma variabilidad relativa: \(10\%\).

¿Cuándo conviene usar el coeficiente de variación?

Conviene usarlo cuando se quieren comparar grupos con medias diferentes.

Por ejemplo, sirve para comparar:

  • puntajes de dos cursos distintos,
  • sueldos de dos empresas,
  • tiempos de entrenamiento de dos grupos deportivos,
  • precios de productos de distinto valor promedio.

Cuidado

El coeficiente de variación no se interpreta en unidades como puntos, pesos, centímetros o segundos.

Se interpreta como porcentaje, porque compara la desviación estándar con la media.

Además, para calcularlo se requiere que la media sea distinta de cero, ya que aparece en el denominador de la fórmula.

Ejemplo 3: decidir qué grupo es más variable

Grupo Media Desviación estándar
Grupo 1 \(20\) \(4\)
Grupo 2 \(50\) \(5\)

Grupo 1:

\(CV=\dfrac{4}{20}\cdot 100\%=20\%\)

Grupo 2:

\(CV=\dfrac{5}{50}\cdot 100\%=10\%\)

El Grupo 1 es más variable, porque su coeficiente de variación es mayor.

Resumen

Concepto Significado
Media Valor promedio de los datos.
Desviación estándar Mide cuánto se alejan los datos de la media.
Coeficiente de variación Mide la dispersión relativa respecto de la media.

Actividad 1

Un grupo de datos tiene media \(40\) y desviación estándar \(8\). Calcula el coeficiente de variación.

Actividad 2

Una muestra tiene media \(120\) y desviación estándar \(18\). Calcula el coeficiente de variación.

Actividad 3

Se comparan dos grupos:

Grupo Media Desviación estándar
A \(30\) \(3\)
B \(80\) \(12\)

¿Cuál grupo presenta mayor variabilidad relativa?

Actividad 4

Dos estudiantes tienen los siguientes resultados en distintas evaluaciones:

Estudiante Promedio Desviación estándar
Estudiante 1 \(6{,}0\) \(0{,}6\)
Estudiante 2 \(5{,}0\) \(0{,}75\)

¿Cuál estudiante tiene resultados más regulares?

Conclusión

El coeficiente de variación permite comparar la dispersión de grupos distintos usando un porcentaje.

Mientras menor sea el \(CV\), más homogéneos son los datos respecto de su media.