Los datos estan dispersos?
9. problemas interpretacion con datos agrupados en intervalos
Problemas interpretacion datos agrupados
Una forma práctica de juzgar si la desviación estándar (\(s\)) es grande o pequeña es compararla directamente con la media (\(\bar{x}\)). Aunque no es una regla estricta, la siguiente guía es muy útil para empezar a interpretar tus resultados:
- Baja Variabilidad: Si la desviación estándar es menor o igual a un décimo (1/10) de la media. Esto indica que los datos son muy consistentes y están agrupados cerca del promedio.
Ejemplo: Para una media de 70 años, una desviación de hasta 7 años (el 10%) se consideraría baja. - Variabilidad Moderada: Si la desviación estándar está entre un décimo (1/10) y tres décimos (3/10) de la media.
Ejemplo: Con la misma media de 70 años, una desviación de 15 años estaría en este rango, indicando una dispersión moderada. - Alta Variabilidad: Si la desviación estándar es mayor o igual a tres décimos (3/10) de la media. Esto sugiere que los datos están muy dispersos y la media es menos representativa del conjunto.
Ejemplo: Para una media de 70 años, una desviación de 25 años (más de 21, que es el 30%) sería considerada alta.
Nota a futuro: Esta comparación es la base de un cálculo que aprenderás formalmente en otra página, llamado Coeficiente de Variación (CV), el cual estandariza esta relación en un porcentaje. Su fórmula es: \[ CV = \left( \frac{s}{|\bar{x}|} \right) \cdot 100\% \]
Nivel Datos Agrupados:
Cálculos que incluyen evaluación de los valores obtenidos en muestras
Ejemplo Guía: Análisis de Hábitos de Lectura
Contexto: Se realiza un sondeo en un club de lectura para conocer el número de páginas que sus miembros leen por semana. Se obtiene una muestra de 50 miembros.
Tareas:
- Calcular la media, varianza y desviación estándar de las páginas leídas.
- Interpretar si el grupo tiene hábitos de lectura consistentes o dispersos, basándose en los resultados.
Nº de Páginas Leídas | Nº de Miembros (\(f_i\)) |
---|---|
[0 - 50) | 5 |
[50 - 100) | 15 |
[100 - 150) | 20 |
[150 - 200) | 8 |
[200 - 250] | 2 |
Resolución del Ejemplo
a) Resultados del Cálculo:
Primero, construimos la tabla completa para obtener los valores necesarios.
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \bar{x}\) | \((x_i - \bar{x})^2\) | \(f_i(x_i - \bar{x})^2\) |
---|---|---|---|---|---|---|
[0 - 50) | 25 | 5 | 125 | -87 | 7569 | 37845 |
[50 - 100) | 75 | 15 | 1125 | -37 | 1369 | 20535 |
[100 - 150) | 125 | 20 | 2500 | 13 | 169 | 3380 |
[150 - 200) | 175 | 8 | 1400 | 63 | 3969 | 31752 |
[200 - 250] | 225 | 2 | 450 | 113 | 12769 | 25538 |
Total | 50 | 5600 | 119050 |
- Media: \(\bar{x} = \frac{5600}{50} = 112\) páginas
- Varianza: \(s^2 = \frac{119050}{49} \approx 2429.59\) páginas²
- Desviación estándar: \(s = \sqrt{2429.59} \approx 49.29\) páginas
b) Interpretación:
El número promedio de páginas leídas es 112. La desviación estándar es de aproximadamente 49 páginas, un valor considerablemente alto en comparación con la media (casi el 44% de la media). Esto nos indica que los hábitos de lectura del club son bastante dispersos y poco consistentes. Hay una gran variabilidad entre los miembros: algunos leen mucho menos que el promedio y otros mucho más.
Ejercicio 4: Tiempos de Traslado al Trabajo
Una consultora de recursos humanos estudia el tiempo de traslado (en minutos) de los empleados de una gran oficina. Se encuesta a una muestra de 100 personas.
- Calcule la media, la varianza y la desviación estándar muestrales.
- Al comparar la media con la desviación estándar que calculaste, ¿consideras que esto indica una alta o baja variabilidad (o consistencia) en los tiempos de traslado? Justifica tu respuesta.
Tiempo (minutos) | Nº de Empleados (\(f_i\)) |
---|---|
[0 - 15) | 10 |
[15 - 30) | 25 |
[30 - 45) | 40 |
[45 - 60) | 20 |
[60 - 75] | 5 |
a) Resultados del Cálculo:
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \bar{x}\) | \((x_i - \bar{x})^2\) | \(f_i(x_i - \bar{x})^2\) |
---|---|---|---|---|---|---|
[0 - 15) | 7.5 | 10 | 75 | -27.75 | 770.0625 | 7700.625 |
[15 - 30) | 22.5 | 25 | 562.5 | -12.75 | 162.5625 | 4064.0625 |
[30 - 45) | 37.5 | 40 | 1500 | 2.25 | 5.0625 | 202.5 |
[45 - 60) | 52.5 | 20 | 1050 | 17.25 | 297.5625 | 5951.25 |
[60 - 75] | 67.5 | 5 | 337.5 | 32.25 | 1040.0625 | 5200.3125 |
Total | 100 | 3525 | 23118.75 |
- Media: \(\bar{x} = 35.25\) minutos
- Varianza: \(s^2 \approx 233.52\) min²
- Desviación estándar: \(s \approx 15.28\) minutos
b) Interpretación:
Una desviación estándar de más de 15 minutos es bastante alta en relación con una media de 35 minutos. Esto indica una alta variabilidad en los tiempos de viaje. Significa que los tiempos no son consistentes; mientras algunos empleados tienen traslados cortos, un número importante tiene viajes muy largos. El promedio por sí solo no describe bien la situación de un empleado "típico" debido a esta alta dispersión.
Ejercicio 5: Gasto Mensual en Ocio
Se realiza una encuesta a una muestra de 60 jóvenes para conocer su gasto mensual en ocio (cine, salidas, etc.), en pesos chilenos.
- Calcule la media, la varianza y la desviación estándar muestrales del gasto.
- Al comparar la media con la desviación estándar, ¿qué te dice la dispersión de los datos sobre la consistencia de los hábitos de consumo del grupo? ¿Son homogéneos o heterogéneos?
Gasto (CLP) | Nº de Jóvenes (\(f_i\)) |
---|---|
[0 - 20000) | 12 |
[20000 - 40000) | 22 |
[40000 - 60000) | 16 |
[60000 - 80000) | 7 |
[80000 - 100000] | 3 |
a) Resultados del Cálculo:
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \bar{x}\) | \((x_i - \bar{x})^2\) | \(f_i(x_i - \bar{x})^2\) |
---|---|---|---|---|---|---|
[0 - 20000) | 10000 | 12 | 120000 | -29000 | 841000000 | 1.0092E+10 |
[20000 - 40000) | 30000 | 22 | 660000 | -9000 | 81000000 | 1.782E+9 |
[40000 - 60000) | 50000 | 16 | 800000 | 11000 | 121000000 | 1.936E+9 |
[60000 - 80000) | 70000 | 7 | 490000 | 31000 | 961000000 | 6.727E+9 |
[80000 - 100000] | 90000 | 3 | 270000 | 51000 | 2601000000 | 7.803E+9 |
Total | 60 | 2340000 | 2.834E+10 |
- Media: \(\bar{x} = 39000\) pesos
- Varianza: \(s^2 \approx 480338983\) pesos²
- Desviación estándar: \(s \approx 21916.64\) pesos
b) Interpretación:
La desviación estándar de casi $22.000 es muy alta en comparación con la media de $39.000 (es más de la mitad de la media). Esto indica que los hábitos de consumo son extremadamente heterogéneos. Existe una gran diferencia entre los que gastan poco y los que gastan mucho, por lo que los datos tienen una consistencia muy baja.
Ejercicio 6: Duración de Baterías de Celulares
Un sitio web de tecnología prueba la duración de la batería (en horas) de una muestra de 40 modelos de celulares nuevos bajo uso continuo.
- Calcule la media, la varianza y la desviación estándar de la duración de las baterías.
- Comparando la media y la desviación estándar que calculaste, ¿consideras que el rendimiento de las baterías en el mercado es consistente o disperso? Interpreta tu conclusión.
Duración (horas) | Nº de Modelos (\(f_i\)) |
---|---|
[4 - 6) | 4 |
[6 - 8) | 10 |
[8 - 10) | 15 |
[10 - 12) | 8 |
[12 - 14] | 3 |
a) Resultados del Cálculo:
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \bar{x}\) | \((x_i - \bar{x})^2\) | \(f_i(x_i - \bar{x})^2\) |
---|---|---|---|---|---|---|
[4 - 6) | 5 | 4 | 20 | -3.8 | 14.44 | 57.76 |
[6 - 8) | 7 | 10 | 70 | -1.8 | 3.24 | 32.4 |
[8 - 10) | 9 | 15 | 135 | 0.2 | 0.04 | 0.6 |
[10 - 12) | 11 | 8 | 88 | 2.2 | 4.84 | 38.72 |
[12 - 14] | 13 | 3 | 39 | 4.2 | 17.64 | 52.86 |
Total | 40 | 352 | 182.34 |
- Media: \(\bar{x} = 8.8\) horas
- Varianza: \(s^2 \approx 4.68\) horas²
- Desviación estándar: \(s \approx 2.16\) horas
b) Interpretación:
La desviación estándar (2.16 horas) es relativamente pequeña en comparación con la media (8.8 horas). Esto indica que los datos tienen una dispersión moderada, lo que se traduce en un rendimiento relativamente consistente en el mercado. Aunque hay variaciones, la mayoría de los celulares no se alejan drásticamente del promedio, ofreciendo un rendimiento predecible.
Nivel 2B:
Cálculos que incluyen evaluación de los valores obtenidos en poblaciones
Ejercicio 7: Calificaciones Finales de un 4° Medio
La siguiente tabla muestra las calificaciones finales de matemática de toda la generación de 4° Medio de un liceo, compuesta por 45 estudiantes. Al ser el universo completo de alumnos, los datos corresponden a una población.
- Calcule la media poblacional (\(\mu\)), la varianza poblacional (\(\sigma^2\)) y la desviación estándar poblacional (\(\sigma\)).
- Comparando la media con la desviación estándar que calculaste, ¿el rendimiento de la generación fue homogéneo o heterogéneo? Justifique.
Calificación | Nº de Estudiantes (\(f_i\)) |
---|---|
[1.0 - 2.0) | 1 |
[2.0 - 3.0) | 3 |
[3.0 - 4.0) | 7 |
[4.0 - 5.0) | 15 |
[5.0 - 6.0) | 12 |
[6.0 - 7.0] | 7 |
a) Resultados del Cálculo:
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \mu\) | \((x_i - \mu)^2\) | \(f_i(x_i - \mu)^2\) |
---|---|---|---|---|---|---|
[1.0 - 2.0) | 1.5 | 1 | 1.5 | -3.22 | 10.3684 | 10.3684 |
[2.0 - 3.0) | 2.5 | 3 | 7.5 | -2.22 | 4.9284 | 14.7852 |
[3.0 - 4.0) | 3.5 | 7 | 24.5 | -1.22 | 1.4884 | 10.4188 |
[4.0 - 5.0) | 4.5 | 15 | 67.5 | -0.22 | 0.0484 | 0.726 |
[5.0 - 6.0) | 5.5 | 12 | 66.0 | 0.78 | 0.6084 | 7.3008 |
[6.0 - 7.0] | 6.5 | 7 | 45.5 | 1.78 | 3.1684 | 22.1788 |
Total | N=45 | 212.5 | 65.778 |
- Media Poblacional: \(\mu = \frac{212.5}{45} \approx 4.72\) puntos
- Varianza Poblacional: \(\sigma^2 = \frac{65.778}{45} \approx 1.46\) puntos²
- Desviación Estándar Poblacional: \(\sigma = \sqrt{1.46} \approx 1.21\) puntos
b) Interpretación:
Para interpretar, comparamos la desviación estándar con la media: \(\frac{1.21}{4.72} \approx 0.256\), lo que equivale a un 25.6%. Según nuestra guía, un valor entre 10% y 30% indica una variabilidad moderada. Por lo tanto, el rendimiento de la generación no fue completamente uniforme, pero tampoco extremadamente disperso; se puede considerar un curso con un rendimiento relativamente predecible.
Ejercicio 8: Producción Diaria de Tornillos
Una máquina produce tornillos y se analiza la longitud de toda la producción de un día, que consta de 200 unidades. Se considera esta producción diaria como una población.
- Calcule la media (\(\mu\)), la varianza poblacional (\(\sigma^2\)) y la desviación estándar poblacional (\(\sigma\)) de la longitud de los tornillos.
- Para un proceso industrial, ¿consideraría que una desviación estándar como la calculada indica un nivel de precisión alto o bajo? Interprete.
Longitud (mm) | Nº de Tornillos (\(f_i\)) |
---|---|
[19.7 - 19.8) | 10 |
[19.8 - 19.9) | 40 |
[19.9 - 20.0) | 90 |
[20.0 - 20.1) | 50 |
[20.1 - 20.2] | 10 |
a) Resultados del Cálculo:
Intervalo | \(x_i\) | \(f_i\) | \(f_i \cdot x_i\) | \(x_i - \mu\) | \((x_i - \mu)^2\) | \(f_i(x_i - \mu)^2\) |
---|---|---|---|---|---|---|
[19.7 - 19.8) | 19.75 | 10 | 197.5 | -0.205 | 0.042025 | 0.42025 |
[19.8 - 19.9) | 19.85 | 40 | 794.0 | -0.105 | 0.011025 | 0.441 |
[19.9 - 20.0) | 19.95 | 90 | 1795.5 | -0.005 | 0.000025 | 0.00225 |
[20.0 - 20.1) | 20.05 | 50 | 1002.5 | 0.095 | 0.009025 | 0.45125 |
[20.1 - 20.2] | 20.15 | 10 | 201.5 | 0.195 | 0.038025 | 0.38025 |
Total | N=200 | 3991.0 | 1.695 |
- Media Poblacional: \(\mu = \frac{3991}{200} = 19.955\) mm
- Varianza Poblacional: \(\sigma^2 = \frac{1.695}{200} = 0.008475\) mm²
- Desviación Estándar Poblacional: \(\sigma = \sqrt{0.008475} \approx 0.092\) mm
b) Interpretación:
La desviación estándar (\(\approx 0.092\) mm) es extremadamente pequeña en comparación con la media (\(19.955\) mm). La relación es \(\frac{0.092}{19.955} \approx 0.0046\), o un 0.46%. Este valor es muy inferior al 10%, lo que indica una variabilidad bajísima. Para un proceso industrial, este resultado es excelente y demuestra un alto nivel de precisión y consistencia en la producción.