Variables correlacion y causalidad

10. Recta de regresión lineal II [pendiente, intercepto, lectura contextual] (PAES M2)

Objetivos

  • Interpretar la pendiente de una recta de regresión lineal en contexto.
  • Interpretar el intercepto de una recta de regresión lineal cuando tenga sentido en la situación.
  • Analizar una recta de regresión considerando sus unidades y el significado de sus parámetros.

Recordemos la forma de la recta

Una recta de regresión lineal suele escribirse como:

\[ \hat{y}=mx+b \]

En esta expresión:

  • \(m\) es la pendiente.
  • \(b\) es el intercepto con el eje \(y\).
  • \(\hat{y}\) representa el valor estimado de la variable dependiente.

Significado de la pendiente

La pendiente \(m\) indica cuánto cambia aproximadamente \(\hat{y}\) cuando \(x\) aumenta en una unidad.

Valor de \(m\) Lectura general
\(m>0\) La recta es creciente: cuando \(x\) aumenta, \(\hat{y}\) tiende a aumentar.
\(m<0\) La recta es decreciente: cuando \(x\) aumenta, \(\hat{y}\) tiende a disminuir.
\(m=0\) La recta es horizontal: \(\hat{y}\) no cambia al aumentar \(x\).

Significado del intercepto

El intercepto \(b\) corresponde al valor estimado de \(\hat{y}\) cuando \(x=0\).

Sin embargo, no siempre tiene una interpretación realista. Para interpretarlo, hay que preguntarse si \(x=0\) tiene sentido en el contexto del problema.

Cuidado con interpretar el intercepto

El intercepto no siempre representa una situación posible.

Por ejemplo, si una recta relaciona edad y estatura en estudiantes de enseñanza media, \(x=0\) años no pertenece al contexto de esos datos. En ese caso, el intercepto puede formar parte del modelo, pero no necesariamente tiene una interpretación práctica.

Ejemplo 1: pendiente positiva

Una recta de regresión para estimar un índice de avance en un plan de preparación, en escala de 0 a 100, según la cantidad de sesiones semanales de trabajo guiado es:

\[ \hat{y}=7x+18 \]

donde \(x\) representa las sesiones semanales de trabajo guiado y \(\hat{y}\) el índice de avance estimado.

La pendiente es \(m=7\).

Esto significa que, por cada sesión semanal adicional de trabajo guiado, el índice de avance estimado aumenta aproximadamente en \(7\) puntos.

El intercepto es \(b=18\).

En este contexto, representa el índice estimado para una persona con \(0\) sesiones semanales de trabajo guiado, según el modelo. Esta interpretación debe tomarse con cuidado si los datos originales no incluyeron casos con \(0\) sesiones.

Ejemplo 2: pendiente negativa

El valor relativo de reventa de un equipo tecnológico, medido en escala de 0 a 100, se modela mediante la recta:

\[ \hat{y}=-8x+92 \]

donde \(x\) es la antigüedad del equipo en años y \(\hat{y}\) es el valor relativo estimado.

La pendiente es \(m=-8\).

Esto significa que, por cada año adicional de antigüedad, el valor relativo estimado disminuye aproximadamente en \(8\) puntos.

El intercepto es \(b=92\).

En este contexto, representa el valor relativo estimado de un equipo con \(0\) años de antigüedad, es decir, nuevo o recién adquirido, según el modelo.

Ejemplo 3: lectura contextual de una recta

Una empresa estima el costo total de un servicio según la cantidad de horas contratadas mediante el modelo:

\[ \hat{y}=15x+20 \]

donde \(x\) representa las horas contratadas y \(\hat{y}\) representa el costo total estimado en miles de pesos.

La pendiente es \(15\). Esto significa que por cada hora adicional contratada, el costo total estimado aumenta en \(15\) mil pesos.

El intercepto es \(20\). Esto puede interpretarse como un cobro fijo inicial de \(20\) mil pesos, aunque se contraten \(0\) horas.

Por lo tanto, el modelo puede representar una situación con un costo base más un cobro por hora.

Cómo interpretar una recta de regresión

  1. Identifica qué representa \(x\).
  2. Identifica qué representa \(\hat{y}\).
  3. Lee la pendiente \(m\) con sus unidades.
  4. Interpreta el intercepto \(b\) solo si \(x=0\) tiene sentido en el contexto.
  5. Evita interpretar la recta fuera del rango de datos observados sin precaución.

Ejemplo 4: intercepto sin interpretación práctica clara

Se estudia la relación entre superficie de una vivienda y consumo eléctrico mensual. Un modelo obtenido es:

\[ \hat{y}=1{,}4x+35 \]

donde \(x\) es la superficie de la vivienda en metros cuadrados y \(\hat{y}\) es el consumo eléctrico mensual estimado en kWh.

La pendiente \(m=1{,}4\) indica que, según el modelo, por cada metro cuadrado adicional de superficie, el consumo eléctrico mensual estimado aumenta aproximadamente \(1{,}4\) kWh.

El intercepto \(b=35\) correspondería al consumo estimado cuando \(x=0\) m².

Pero una vivienda de \(0\) m² no tiene sentido práctico. Por eso, el intercepto forma parte del modelo, pero no tiene una interpretación realista directa en esta situación.

Error común

No se debe decir solamente “la pendiente es 7” sin indicar qué significa.

Una buena interpretación debe incluir las unidades y el contexto. Por ejemplo: “por cada sesión semanal adicional de trabajo guiado, el índice estimado aumenta aproximadamente 7 puntos”.

Ejercicio 1

Una recta de regresión para estimar un índice de implementación tecnológica, en escala de 0 a 100, según la cantidad de capacitaciones realizadas por un equipo docente es:

\[ \hat{y}=6x+22 \]

donde \(x\) representa el número de capacitaciones realizadas y \(\hat{y}\) el índice de implementación estimado.

  1. Interpreta la pendiente en contexto.
  2. Interpreta el intercepto, indicando una precaución necesaria.
  3. Calcula el índice estimado para \(x=8\).

Ejercicio 2

Una recta de regresión para estimar un índice de satisfacción de usuarios, en escala de 0 a 100, según el tiempo de espera en atención es:

\[ \hat{y}=-5x+92 \]

donde \(x\) representa el tiempo de espera en minutos y \(\hat{y}\) el índice de satisfacción estimado.

  1. Interpreta la pendiente en contexto.
  2. Interpreta el intercepto en contexto.
  3. Estima el índice de satisfacción para un tiempo de espera de \(8\) minutos.

Ejercicio 3

Una empresa modela un índice de costo de producción, en escala de 0 a 100, mediante la recta:

\[ \hat{y}=4x+18 \]

donde \(x\) representa la cantidad de lotes producidos y \(\hat{y}\) representa el índice de costo estimado.

  1. ¿Qué representa la pendiente \(4\)?
  2. ¿Qué representa el intercepto \(18\)?
  3. ¿Por qué este modelo puede representar una situación con costo fijo y costo variable?

Ejercicio 4

Se ajustó una recta de regresión para estimar el consumo eléctrico mensual de viviendas según su superficie:

\[ \hat{y}=1{,}4x+35 \]

donde \(x\) representa la superficie de la vivienda en metros cuadrados y \(\hat{y}\) representa el consumo eléctrico mensual estimado en kWh.

Los datos observados corresponden a viviendas entre \(35\) m² y \(140\) m².

Un estudiante interpreta:

“El intercepto \(35\) significa que una vivienda de \(0\) m² consume 35 kWh al mes”.

Analiza la interpretación del estudiante.

Ejercicio 5

Dos modelos lineales se proponen para estimar un índice de preparación, en escala de 0 a 100, según la cantidad de sesiones semanales de trabajo guiado.

Modelo Recta de regresión Contexto de los datos
Modelo A \(\hat{y}=8x+24\) Datos de estudiantes que realizaron entre \(1\) y \(7\) sesiones semanales.
Modelo B \(\hat{y}=5x+40\) Datos de estudiantes que realizaron entre \(5\) y \(12\) sesiones semanales.

Una estudiante quiere estimar el índice de preparación de alguien que realiza \(9\) sesiones semanales.

  1. Calcula la estimación con ambos modelos.
  2. Indica cuál modelo sería más prudente usar para \(x=9\), considerando el rango de datos.
  3. Explica por qué no basta con elegir el modelo que entrega el índice más alto.

Ejercicio 6

Una recta de regresión para estimar la cantidad de ventas mensuales de una tienda según el número de visitas a su sitio web es:

\[ \hat{y}=0{,}04x+180 \]

donde \(x\) representa el número de visitas mensuales al sitio web y \(\hat{y}\) representa la cantidad estimada de ventas mensuales.

Un informe interpreta la pendiente así:

“Por cada visita adicional al sitio web, se estiman \(0{,}04\) ventas más”.

La interpretación es correcta, pero poco comunicativa para un informe. Reescríbela usando un aumento de \(1000\) visitas y explica por qué esa versión es más útil.

Cierre

La pendiente y el intercepto de una recta de regresión no son solo números: deben interpretarse en el contexto de las variables estudiadas.

La pendiente indica el cambio estimado en \(\hat{y}\) por cada unidad adicional de \(x\), mientras que el intercepto representa el valor estimado cuando \(x=0\), siempre que esa interpretación tenga sentido.

Al trabajar con gráficos cartesianos, es importante escoger contextos y escalas que permitan una lectura clara de los datos y del modelo.