Los datos estan dispersos?
7. Coeficiente de Variación
Coeficiente de Variación (CV)
¿Por qué necesitamos otra medida de dispersión?
Hemos visto que la desviación estándar mide la dispersión *absoluta* de los datos alrededor de la media. Pero, ¿qué pasa si queremos comparar la variabilidad entre conjuntos de datos que tienen unidades diferentes o medias muy distintas? Ahí es donde entra en juego el Coeficiente de Variación (CV).
Definición y Fórmula
El Coeficiente de Variación (CV) es una medida de dispersión relativa. Expresa la desviación estándar como un porcentaje de la media. Esto nos permite comparar la variabilidad entre conjuntos de datos que, de otra manera, no serían comparables directamente.
Fórmula (para una muestra):
\[ \Large \color{blue}{\boxed{ CV = \frac{s}{\bar{x}} \times 100\% }} \]
Fórmula (para una población):
\[ \Large \color{blue}{\boxed{ CV = \frac{\sigma}{\mu} \times 100\% }} \]
Donde:
- \(CV\) es el coeficiente de variación.
- \(s\) es la desviación estándar muestral.
- \(\bar{x}\) es la media muestral (y \(\bar{x} \neq 0\)).
- \(\sigma\) es la desviación estándar poblacional.
- \(\mu\) es la media poblacional (y \(\mu \neq 0\)).
Importante: La media debe ser distinta de cero para que el CV tenga sentido. No se puede dividir por cero.
Interpretación
- Sin unidades: El CV es adimensional. No tiene unidades de medida, ya que las unidades de la desviación estándar y la media se cancelan. Esto es lo que permite comparar la variabilidad entre conjuntos de datos con diferentes unidades.
- Dispersión relativa: El CV nos dice qué tan grande es la desviación estándar *en relación con* la media. Un CV del 20% significa que la desviación estándar es el 20% de la media.
- Valores altos vs. bajos:
- Un CV *más alto* indica *mayor* dispersión relativa.
- Un CV *más bajo* indica *menor* dispersión relativa.
- No hay valores "buenos" o "malos": No existe un umbral universal para interpretar el CV como "alto" o "bajo". Depende *totalmente del contexto*. En algunos campos (como la ingeniería de precisión), un CV del 5% podría considerarse alto. En otros (como las ciencias sociales), un CV del 30% podría considerarse normal.
Ejemplos
Ejemplo 1 (Comparación con diferentes unidades):
Queremos comparar la variabilidad de la altura (en cm) y el peso (en kg) de un grupo de personas:
- Alturas: Media = 170 cm, Desviación estándar = 10 cm
- Pesos: Media = 70 kg, Desviación estándar = 14 kg
No podemos comparar directamente las desviaciones estándar (10 cm vs. 14 kg) porque tienen unidades diferentes. Calculamos el CV:
- CV (Alturas) = (10 cm / 170 cm) * 100% ≈ 5.88%
- CV (Pesos) = (14 kg / 70 kg) * 100% = 20%
Conclusión: El peso tiene una variabilidad relativa *mucho mayor* que la altura en este grupo.
Ejemplo 2 (Comparación con medias muy diferentes):
Queremos comparar la variabilidad de los ingresos en dos grupos:
- Grupo A (Estudiantes): Media = $500, Desviación estándar = $100
- Grupo B (Profesionales): Media = $5000, Desviación estándar = $500
Aunque la desviación estándar del Grupo B es mucho mayor en términos absolutos, calculamos el CV:
- CV (Grupo A) = ($100 / $500) * 100% = 20%
- CV (Grupo B) = ($500 / $5000) * 100% = 10%
Conclusión: Los ingresos del Grupo A (estudiantes) tienen una variabilidad relativa *mayor* que los del Grupo B (profesionales).
Ejercicios
Ejercicio 1: Calcula el CV para los siguientes conjuntos de datos:
- Media = 60, Desviación estándar = 9
- Media = 15, Desviación estándar = 3
- Media = 1200, Desviación estándar = 60
Ejercicio 2: Un investigador compara la variabilidad en la duración de dos tipos de bombillas. La bombilla A tiene una duración promedio de 800 horas con una desviación estándar de 80 horas. La bombilla B tiene una duración promedio de 1200 horas con una desviación estándar de 100 horas. ¿Qué tipo de bombilla tiene mayor variabilidad relativa en su duración?
Ejercicio 3: Explica con tus propias palabras por qué el Coeficiente de Variación es útil para comparar la dispersión de conjuntos de datos que tienen diferentes unidades de medida.
© 2024 - Material de Apoyo