3. Medidas de Dispersión: Rango, Varianza y Desviación Estándar

Medidas de Dispersión: Rango, Varianza y Desviación Estándar

Repaso: ¿Qué es la Dispersión?

La dispersión (o variabilidad) indica qué tan "esparcidos" están los datos alrededor de un valor central (como la media). Alta dispersión significa datos muy alejados; baja dispersión, datos agrupados cerca de la media.

El Rango

Definición y Fórmula

El rango es la medida de dispersión más simple: la diferencia entre el valor máximo y el mínimo.

Fórmula:

\[ \Large  \color{blue}{\boxed{Rango = Valor Máximo - Valor Mínimo }} \]

Ejemplos

Ejemplo 1: Datos: 5, 8, 10, 12, 15. Rango = 15 - 5 = 10

Ejemplo 2: Datos: 23, 23, 24, 25, 26. Rango = 26 - 23 = 3

Ventajas y Desventajas

  • Ventajas: Fácil de calcular y entender. Da una idea rápida de la extensión total.
  • Desventajas: Muy sensible a valores extremos. No usa toda la información. No indica la distribución.

La Varianza

Concepto

La varianza es una medida de dispersión que indica qué tan lejos están los datos de la media *al cuadrado*. Es un paso intermedio para calcular la desviación estándar, y aunque no es tan intuitiva de interpretar directamente como la desviación estándar, es fundamental en muchos cálculos estadísticos más avanzados.

Cálculo Paso a Paso (Manual)

Ejemplo: Datos: 2, 4, 6, 8, 10

  1. Calcular la media (\(\bar{x}\)): \[ \bar{x} = \frac{2 + 4 + 6 + 8 + 10}{5} = 6 \]
  2. Calcular las desviaciones (restar la media a cada dato):
    • 2 - 6 = -4
    • 4 - 6 = -2
    • 6 - 6 = 0
    • 8 - 6 = 2
    • 10 - 6 = 4
  3. Elevar al cuadrado cada desviación:
    • (-4)² = 16
    • (-2)² = 4
    • (0)² = 0
    • (2)² = 4
    • (4)² = 16
  4. Sumar los cuadrados de las desviaciones: 16 + 4 + 0 + 4 + 16 = 40
  5. Dividir por n (población) o n-1 (muestra):
    • Muestra (n-1): 40 / (5-1) = 10 (Varianza muestral, \(s^2\))
    • Población ( n ): 40 / 5 = 8 (Varianza poblacional, \(\sigma^2\))



En la practica usamos tablas 

En la práctica, para calcular la varianza de un conjunto de datos de manera más organizada y eficiente, se recomienda utilizar una tabla. Esta tabla nos permitirá visualizar claramente cada paso del proceso, desde el cálculo de la media hasta la obtención de la varianza final


Ejemplo anterior:

Datos: 2, 4, 6, 8, 10

1°. Calculamos la media (x̄)
  • Sumamos todos los datos: 2 + 4 + 6 + 8 + 10 = 30
  • Dividimos la suma por el número total de datos (5): 30 / 5 = 6
  • La media (x̄) es 6
2°. Llenamos la primera columna (xi)

Anotamos cada uno de los datos originales en la primera columna:

xi Media (x̄) xi - x̄ (xi - x̄)²
2
4
6
8
10

3°. Llenamos la segunda columna (Media x̄)(columna opcional)

Escribimos la media (6) en cada fila de la segunda columna:

xi Media (x̄) xi - x̄ (xi - x̄)²
2 6
4 6
6 6
8 6
10 6

4°. Llenamos la tercera columna (xi - x̄)

Restamos la media (6) a cada dato (xi) y anotamos los resultados en la tercera columna:

xi Media (x̄) xi - x̄ (xi - x̄)²
2 6 -4
4 6 -2
6 6 0
8 6 2
10 6 4

5°. Llenamos la cuarta columna ((xi - x̄)²)

Elevamos al cuadrado cada valor de la tercera columna y lo anotamos en la cuarta columna:

xi Media (x̄) xi - x̄ (xi - x̄)²
2 6 -4 16
4 6 -2 4
6 6 0 0
8 6 2 4
10 6 4 16

6°. Sumamos los cuadrados de las desviaciones

Sumamos todos los valores de la cuarta columna: 16 + 4 + 0 + 4 + 16 = 40

xi Media (x̄) xi - x̄ (xi - x̄)²
2 6 -4 16
4 6 -2 4
6 6 0 0
8 6 2 4
10 6 4 16
40

7. Dividimos por n (población) o n-1 (muestra)

Muestra (n-1): 40 / (5 - 1) = 10 (Varianza muestral, s²)

Población ( n ): 40 / 5 = 8 (Varianza poblacional, σ²)



Fórmula (Muestra):

\[ \Large \color{blue}{\boxed{    s^2 = \frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}         }} \]

Fórmula (Población): 

\[ \Large \color{blue}{\boxed{     \sigma^2 = \frac{\sum_{i=1}^{n}(x_i - \mu)^2}{n}         }} \]

Donde:

  • \(s^2\) es la varianza muestral.
  • \(\sigma^2\) es la varianza poblacional.
  • \(x_i\) son los valores individuales.
  • \(\bar{x}\) es la media muestral.
  • \(\mu\) es la media poblacional.
  • \(n\) es el número de datos.
  • \(\sum\) es "suma de".

Interpretación

  • Una varianza de 0 indica que todos los datos son idénticos a la media.
  • Cuanto mayor sea la varianza, mayor será la dispersión de los datos.
  • La varianza por sí sola no es tan fácil de interpretar directamente como la desviación estándar, porque está en unidades cuadradas.

Desviación Típica (o Estándar)

Concepto y Relación con la Varianza

La desviación típica (o estándar) es la raíz cuadrada de la varianza. Es la medida de dispersión más utilizada porque es más fácil de interpretar que la varianza, ya que está en las mismas unidades que los datos originales.

Cálculo

Simplemente se calcula la raíz cuadrada de la varianza:

Fórmula (Muestra): \[ \Large \color{blue}{\boxed{ s = \sqrt{s^2} = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}} }} \]

Fórmula (Población): \[ \Large \color{blue}{\boxed{ \sigma = \sqrt{\sigma^2} = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \mu)^2}{n}} }} \]

Ejemplo (continuación del anterior):

  • Si usamos la varianza muestral (10): \( s = \sqrt{10} \approx 3.16 \)
  • Si usamos la varianza poblacional (8): \( \sigma = \sqrt{8} \approx 2.83 \)

Uso de Calculadora

Las calculadoras y hojas de cálculo tienen funciones para calcular la desviación estándar directamente: `STDEV.S` (muestra) o `STDEV.P` (población) en hojas de cálculo, o las teclas `s` o `σ` en calculadoras.

Interpretación

Ejemplo: Si la media de las alturas es 170 cm y la desviación estándar es 5 cm, significa que, en promedio, las alturas se desvían aproximadamente 5 cm de la media.

  • Desviación estándar baja: Datos agrupados cerca de la media.
  • Desviación estándar alta: Datos más dispersos.

Ejercicios y Problemas

Ejercicio 1: Calcula el rango de los siguientes conjuntos de datos:

  1. 50, 60, 70, 80, 90
  2. 1, 3, 2, 7, 5, 4
  3. 120, 125, 118, 122, 124

Ejercicio 2: Calcula la varianza (muestral) de los siguientes datos, paso a paso (manualmente): 3, 5, 7, 9, 11

Ejercicio 3: Calcula la desviación típica (muestral) de los datos del Ejercicio 2. Comprueba tu resultado usando una calculadora o software.

Problema 1: Las edades de dos grupos de amigos son:

Grupo A: 18, 19, 20, 21, 22

Grupo B: 15, 20, 18, 25, 17

  1. Calcula la media, el rango, la varianza y la desviación típica (muestral) para cada grupo.
  2. ¿Qué grupo tiene edades más homogéneas (menos dispersas)? ¿Cómo lo sabes?

Problema 2: Se mide la longitud (en cm) de 10 tornillos producidos por una máquina:

5.0, 5.1, 4.9, 5.2, 5.0, 4.8, 5.1, 5.3, 4.9, 5.0

  1. Calcula la media, la varianza y la desviación típica (muestral) de las longitudes.
  2. Si la longitud ideal es 5.0 cm, y se consideran aceptables los tornillos con una longitud dentro de una desviación típica de la media, ¿qué rango de longitudes se considera aceptable?
  3. ¿Cuántos de los tornillos medidos están dentro del rango aceptable?

© 2025 - Material de Apoyo