Variables correlacion y causalidad
1. Nube de puntos I [lectura cualitativa de relación]
Objetivos
- Reconocer una nube de puntos como una representación gráfica de dos variables cuantitativas.
- Leer cualitativamente si dos variables parecen estar relacionadas.
- Describir una relación entre variables usando lenguaje estadístico claro y contextualizado.
¿Qué es una nube de puntos?
Una nube de puntos es un gráfico que permite representar datos formados por pares de valores.
Cada punto del gráfico corresponde a una observación de la forma \((x,y)\), donde:
- \(x\) representa el valor de una variable.
- \(y\) representa el valor de otra variable.
Este tipo de gráfico se usa para estudiar si entre dos variables existe algún tipo de relación.
Lectura básica de una nube de puntos
Al observar una nube de puntos, conviene fijarse en tres aspectos:
- Dirección: si al aumentar una variable, la otra tiende a aumentar o disminuir.
- Forma: si los puntos parecen seguir una tendencia aproximadamente lineal o no.
- Dispersión: si los puntos están muy agrupados o muy separados entre sí.
Ejemplo 1: sesiones de preparación y puntaje
La siguiente tabla muestra la cantidad de sesiones de preparación realizadas por algunos estudiantes y el puntaje obtenido en una evaluación diagnóstica.
| Estudiante | Sesiones de preparación | Puntaje |
|---|---|---|
| A | 1 | 42 |
| B | 2 | 48 |
| C | 3 | 55 |
| D | 4 | 61 |
| E | 5 | 66 |
| F | 6 | 74 |
En el gráfico se observa que, a medida que aumentan las sesiones de preparación, el puntaje también tiende a aumentar.
Por lo tanto, podemos decir que entre estas variables parece existir una relación creciente.
Error común
No basta con mirar un solo punto para concluir que existe una relación. La lectura debe hacerse observando el comportamiento general de toda la nube de puntos.
Ejemplo 2: días desde una publicación y consultas recibidas
La siguiente nube de puntos relaciona la cantidad de días desde que se publicó un aviso informativo con el número de consultas diarias recibidas.
En este caso, cuando aumentan los días desde la publicación, la cantidad de consultas diarias tiende a disminuir.
Por lo tanto, la nube de puntos muestra una relación decreciente.
Cómo describir una nube de puntos
Una buena descripción debe mencionar las variables y la tendencia observada.
Por ejemplo:
“A medida que aumentan las sesiones de preparación, el puntaje tiende a aumentar.”
Esta descripción es mejor que decir solamente “sube”, porque menciona claramente el contexto de los datos.
Ejercicio 1
Una municipalidad registró, durante ocho semanas, la cantidad de actividades deportivas gratuitas realizadas y la asistencia total de jóvenes.
| Semana | Actividades deportivas \(x\) | Asistencia total \(y\) |
|---|---|---|
| 1 | 1 | 42 |
| 2 | 2 | 58 |
| 3 | 3 | 61 |
| 4 | 4 | 79 |
| 5 | 5 | 76 |
| 6 | 6 | 94 |
| 7 | 7 | 103 |
| 8 | 8 | 99 |
Redacta una interpretación estadística de la relación observada. Tu respuesta debe mencionar:
- las dos variables;
- la tendencia general;
- por qué no conviene usar la palabra “siempre”.
Las variables estudiadas son la cantidad de actividades deportivas gratuitas y la asistencia total de jóvenes.
En general, cuando aumenta el número de actividades deportivas, la asistencia total tiende a aumentar.
Sin embargo, no se debe decir que la asistencia aumenta siempre, porque hay semanas que no siguen exactamente ese comportamiento. Por ejemplo, al pasar de \(4\) a \(5\) actividades, la asistencia baja de \(79\) a \(76\), y al pasar de \(7\) a \(8\), baja de \(103\) a \(99\).
Por eso, la interpretación debe hablar de una tendencia general y no de una regla exacta.
Respuesta: existe una tendencia creciente entre actividades deportivas y asistencia total, pero con variación en los datos.
Ejercicio 2
La siguiente nube de puntos relaciona el tiempo promedio de traslado al colegio con la cantidad de minutos disponibles para desayunar.
Un estudiante afirma: “Como los puntos bajan, entonces ambas variables disminuyen al mismo tiempo”.
Evalúa la afirmación y corrígela usando el significado de los ejes.
La afirmación no está bien formulada.
En el eje \(x\), el tiempo de traslado aumenta cuando avanzamos hacia la derecha. Por lo tanto, no es correcto decir que ambas variables disminuyen al mismo tiempo.
Lo que ocurre es que, cuando aumenta el tiempo de traslado, disminuye el tiempo disponible para desayunar.
La interpretación correcta debe relacionar el aumento de una variable con la disminución de la otra.
Respuesta: no es correcta; la relación es decreciente porque a mayor tiempo de traslado, menor tiende a ser el tiempo disponible para desayunar.
Ejercicio 3
En una encuesta se registró la cantidad de horas semanales dedicadas a redes sociales y el promedio de horas de sueño por noche.
| Persona | Horas semanales en redes sociales \(x\) | Horas de sueño por noche \(y\) |
|---|---|---|
| A | 4 | 8,2 |
| B | 7 | 7,8 |
| C | 10 | 7,3 |
| D | 13 | 7,1 |
| E | 16 | 6,7 |
| F | 19 | 6,5 |
| G | 22 | 6,0 |
Sin calcular ningún coeficiente, responde:
- ¿Qué tendencia general parece existir?
- Redacta una conclusión cuidadosa, evitando afirmar causalidad.
- Menciona una variable externa que podría influir en la relación observada.
Al aumentar las horas semanales dedicadas a redes sociales, las horas de sueño por noche tienden a disminuir.
Por lo tanto, la tendencia observada es decreciente.
Una conclusión cuidadosa sería: “En estos datos, las personas que reportan más horas semanales en redes sociales tienden a dormir menos horas por noche”.
No corresponde afirmar automáticamente que usar redes sociales causa dormir menos, porque podrían influir otras variables.
Por ejemplo, podrían influir la carga académica, horarios familiares, estrés, trabajo remunerado, uso de videojuegos, actividades extracurriculares o hábitos de sueño.
Respuesta: la tendencia parece decreciente, pero no basta para afirmar causalidad.
Ejercicio 4
Una tienda analizó la relación entre el precio de distintos audífonos y la cantidad de unidades vendidas durante un mes.
| Modelo | Precio \(x\) | Unidades vendidas \(y\) |
|---|---|---|
| A | 8000 | 120 |
| B | 10000 | 105 |
| C | 12000 | 98 |
| D | 15000 | 76 |
| E | 18000 | 70 |
| F | 22000 | 52 |
| G | 26000 | 43 |
Un informe propone la siguiente conclusión:
“Subir el precio de un audífono provoca necesariamente que se vendan menos unidades”.
Reescribe la conclusión para que sea estadísticamente más adecuada y explica qué problema tiene la frase original.
La frase original es demasiado fuerte porque usa la palabra “provoca” y afirma una causalidad necesaria.
Con los datos disponibles solo podemos describir una relación observada entre las variables, no demostrar automáticamente una causa.
Una conclusión más adecuada sería:
“En estos datos, los audífonos de mayor precio tienden a vender menos unidades durante el mes observado”.
También podrían influir otras variables, como marca, calidad, promociones, disponibilidad, diseño o reputación del producto.
Respuesta: se observa una relación decreciente entre precio y unidades vendidas, pero no corresponde afirmar causalidad necesaria solo con estos datos.
Ejercicio 5
Dos cursos registraron la relación entre horas de preparación semanal y puntaje en una evaluación. Las descripciones de sus nubes de puntos son las siguientes:
| Curso | Descripción de la nube de puntos |
|---|---|
| Curso A | Los puntos suben hacia la derecha, pero hay bastante dispersión. |
| Curso B | Los puntos suben hacia la derecha y se mantienen cercanos a una misma dirección. |
Ambos cursos muestran una relación creciente. ¿En cuál curso la relación parece más clara? Justifica usando la idea de dispersión.
En ambos cursos la relación parece creciente, porque los puntos suben hacia la derecha.
Sin embargo, en el Curso B la relación parece más clara, porque los puntos están menos dispersos y siguen una dirección más definida.
En el Curso A, aunque hay tendencia creciente, la mayor dispersión indica que los puntajes varían más para cantidades similares de horas de preparación.
Por lo tanto, la nube del Curso B permite reconocer con mayor claridad la relación entre las variables.
Respuesta: la relación parece más clara en el Curso B, porque presenta menor dispersión.
Cierre
Una nube de puntos permite hacer una primera lectura de la relación entre dos variables cuantitativas.
En esta lectura inicial conviene describir la tendencia general, evitar conclusiones absolutas y considerar que puede existir variación entre los puntos.
