Variables correlacion y causalidad
2. Nube de puntos II [tendencia positiva, negativa o nula]
Objetivos
- Distinguir tendencias positivas, negativas y nulas en una nube de puntos.
- Interpretar el sentido de una relación entre dos variables cuantitativas.
- Describir una tendencia usando lenguaje estadístico claro, contextualizado y cuidadoso.
Sentido de la relación entre dos variables
Cuando observamos una nube de puntos, una de las primeras preguntas es:
¿Qué ocurre con una variable cuando la otra aumenta?
Según el comportamiento general de los puntos, podemos reconocer tres situaciones principales:
- Tendencia positiva: cuando \(x\) aumenta, \(y\) tiende a aumentar.
- Tendencia negativa: cuando \(x\) aumenta, \(y\) tiende a disminuir.
- Tendencia nula: no se observa una dirección clara en los puntos.
Resumen de tendencias
| Tipo de tendencia | Descripción | Lectura general |
|---|---|---|
| Positiva | Los puntos tienden a subir hacia la derecha. | Si \(x\) aumenta, \(y\) tiende a aumentar. |
| Negativa | Los puntos tienden a bajar hacia la derecha. | Si \(x\) aumenta, \(y\) tiende a disminuir. |
| Nula | Los puntos no muestran una dirección clara. | No se observa una relación evidente entre \(x\) e \(y\). |
Ejemplo 1: tendencia positiva
La siguiente nube de puntos relaciona la cantidad de horas de práctica semanal con el puntaje obtenido en una prueba de habilidad.
Los puntos tienden a subir hacia la derecha.
Esto significa que, a mayor cantidad de horas de práctica semanal, mayor tiende a ser el puntaje.
Por lo tanto, se observa una tendencia positiva.
Ejemplo 2: tendencia negativa
La siguiente nube de puntos relaciona la antigüedad de un teléfono, en años, con su precio estimado de venta.
Los puntos tienden a bajar hacia la derecha.
Esto significa que, a mayor antigüedad del teléfono, menor tiende a ser su precio estimado.
Por lo tanto, se observa una tendencia negativa.
Ejemplo 3: tendencia nula
La siguiente nube de puntos relaciona un código interno asignado a estudiantes con el puntaje obtenido en una evaluación.
Los puntos no muestran una dirección clara. No se observa que el puntaje aumente o disminuya sistemáticamente al aumentar el código interno.
Por lo tanto, en este caso se observa una tendencia nula o ausencia de tendencia clara.
Error común
Una nube de puntos puede tener algunos puntos que no siguen exactamente la tendencia general.
Por eso, no se debe decidir la tendencia usando solo un punto aislado. Lo importante es observar el comportamiento global de la nube.
Estrategia para identificar la tendencia
- Mira los puntos de izquierda a derecha.
- Pregunta qué ocurre con \(y\) cuando \(x\) aumenta.
- Identifica si la dirección general es creciente, decreciente o no clara.
- Observa si hay puntos que se alejan del patrón general.
- Redacta la conclusión usando expresiones como “tiende a”, “en general” o “se observa”.
Ejercicio 1
Una municipalidad estudia la relación entre la inversión mensual en actividades culturales gratuitas y la asistencia total de público durante ocho meses.
| Mes | Inversión \(x\) en millones de pesos | Asistencia \(y\) |
|---|---|---|
| 1 | 2 | 420 |
| 2 | 3 | 510 |
| 3 | 4 | 530 |
| 4 | 5 | 690 |
| 5 | 6 | 640 |
| 6 | 7 | 760 |
| 7 | 8 | 850 |
| 8 | 9 | 790 |
Redacta una interpretación completa de la tendencia observada. Tu respuesta debe considerar que no todos los puntos siguen exactamente el mismo comportamiento.
En general, cuando aumenta la inversión mensual, también tiende a aumentar la asistencia total.
Sin embargo, la relación no es perfectamente creciente. Por ejemplo, al pasar de \(5\) a \(6\) millones, la asistencia baja de \(690\) a \(640\), y al pasar de \(8\) a \(9\) millones, baja de \(850\) a \(790\).
Por eso, no sería correcto decir que cada aumento en inversión produce siempre un aumento en asistencia.
La interpretación más adecuada es que existe una tendencia positiva general con cierta dispersión.
Respuesta: se observa una tendencia positiva, pero no perfecta; a mayor inversión, la asistencia tiende a ser mayor, aunque hay variaciones entre meses.
Ejercicio 2
Una empresa analiza la relación entre el precio de distintos planes mensuales y la cantidad de clientes nuevos que contrataron cada plan.
Un analista afirma: “La tendencia es negativa, por lo tanto el último dato debe eliminarse porque está malo”.
Evalúa críticamente la afirmación.
La nube muestra una tendencia negativa general: a mayor precio del plan, menor tiende a ser la cantidad de clientes nuevos.
Sin embargo, el último punto \((22000,910)\) se aleja de esa tendencia. Eso no significa automáticamente que el dato esté malo.
Podría tratarse de un plan especial, una promoción, una mejor cobertura, mayor prestigio de marca u otra característica no representada solo por el precio.
Eliminar un dato requiere una justificación, como error de registro o evidencia de que no pertenece a la misma población de estudio.
Respuesta: la tendencia general es negativa, pero no se debe eliminar el último dato solo porque no sigue la tendencia; primero hay que investigar su contexto.
Ejercicio 3
Dos cursos rindieron un diagnóstico y luego una prueba final. En ambos casos se estudió la relación entre puntaje diagnóstico \(x\) y puntaje final \(y\).
| Curso | Descripción de la nube de puntos |
|---|---|
| Curso A | Los puntos suben hacia la derecha, pero están bastante dispersos. |
| Curso B | Los puntos suben hacia la derecha y están muy cerca de una misma dirección. |
Ambos cursos presentan tendencia positiva. ¿En qué curso la tendencia positiva parece más clara? Justifica usando la idea de dispersión.
En ambos cursos la tendencia es positiva, porque los puntos suben hacia la derecha.
Sin embargo, en el Curso B los puntos están más cercanos a una misma dirección, por lo que la tendencia positiva es más clara.
En el Curso A la mayor dispersión indica que, aunque hay una tendencia creciente, los datos varían más respecto de esa tendencia.
Respuesta: la tendencia positiva parece más clara en el Curso B, porque sus puntos están menos dispersos.
Ejercicio 4
Un estudio sobre acceso a servicios digitales compara la edad de las personas con la cantidad de trámites digitales realizados durante el último mes.
Escoge la conclusión más defendible según el gráfico y justifica por qué las otras opciones no son adecuadas.
- A mayor edad, menor es siempre la cantidad de trámites digitales.
- A mayor edad, mayor es siempre la cantidad de trámites digitales.
- No se observa una tendencia lineal clara entre edad y trámites digitales realizados.
- La edad permite predecir exactamente cuántos trámites digitales hará una persona.
La alternativa más defendible es la 3.
Los puntos no suben ni bajan de manera clara al avanzar hacia la derecha. Hay personas de distintas edades con valores altos y bajos de trámites digitales.
Las alternativas 1 y 2 no son adecuadas porque usan “siempre”, lo cual no se sostiene con el gráfico.
La alternativa 4 tampoco es adecuada, porque una nube de puntos no permite predecir exactamente el comportamiento de una persona.
Respuesta: la alternativa correcta es 3; no se observa una tendencia lineal clara.
Ejercicio 5
Una organización estudia la relación entre el número de voluntarios disponibles y el tiempo que tarda en completar una campaña de recolección.
| Campaña | Voluntarios \(x\) | Tiempo de ejecución \(y\) en días |
|---|---|---|
| A | 8 | 18 |
| B | 10 | 15 |
| C | 12 | 14 |
| D | 15 | 11 |
| E | 18 | 9 |
| F | 20 | 10 |
| G | 24 | 7 |
Redacta una interpretación completa de la tendencia. Luego explica por qué sería incorrecto afirmar que “cada voluntario adicional reduce exactamente la misma cantidad de días”.
La relación observada es decreciente: cuando aumenta la cantidad de voluntarios disponibles, el tiempo de ejecución de la campaña tiende a disminuir.
Sin embargo, los cambios no son constantes. Por ejemplo, al pasar de \(18\) a \(20\) voluntarios, el tiempo aumenta de \(9\) a \(10\) días, lo que no sigue perfectamente la tendencia general.
Además, la nube de puntos describe una tendencia, no una regla exacta para cada caso particular.
Respuesta: se observa una tendencia negativa general; más voluntarios tienden a asociarse con menor tiempo de ejecución, pero no con una disminución exacta e igual en todos los casos.
Ejercicio 6
Una noticia afirma:
“Las comunas con mayor número de cámaras de seguridad registran más denuncias. Por lo tanto, las cámaras provocan delincuencia”.
Desde el punto de vista estadístico, analiza la conclusión. Considera que la noticia solo muestra una nube de puntos con tendencia positiva entre número de cámaras y número de denuncias.
La conclusión es apresurada.
Una tendencia positiva entre número de cámaras y número de denuncias indica que ambas variables tienden a aumentar juntas, pero no demuestra que una cause la otra.
Podría ocurrir que las comunas con más denuncias instalen más cámaras, o que comunas más pobladas tengan al mismo tiempo más cámaras y más denuncias.
También podría influir el nivel de urbanización, la población flotante, la actividad comercial o la capacidad de registrar delitos.
Una conclusión más cuidadosa sería: “se observa una relación positiva entre el número de cámaras y el número de denuncias, pero se requiere más información para hablar de causalidad”.
Respuesta: la conclusión no es válida solo con la nube de puntos; tendencia positiva no implica causalidad.
Cierre
Identificar una tendencia no consiste solo en decir si una nube “sube” o “baja”. También es necesario observar la dispersión, reconocer puntos que se alejan del patrón general y redactar conclusiones cuidadosas.
Una buena interpretación estadística describe lo que se observa en los datos, sin transformar una tendencia en una regla exacta ni en una afirmación causal automática.