Probabilidad básica

12. Tablas de contingencia: condicionales, marginales y conjuntas

Objetivo de aprendizaje

  • Calcular e interpretar probabilidades conjuntas, marginales y condicionales a partir de tablas de contingencia.

Tres lecturas de una misma tabla

Una tabla de contingencia permite estudiar dos características al mismo tiempo. A partir de ella se pueden obtener tres tipos de probabilidades:

  • Probabilidad conjunta: considera dos condiciones simultáneamente.
  • Probabilidad marginal: considera una sola característica, usando un total de fila o columna.
  • Probabilidad condicional: considera una característica sabiendo que otra ya ocurrió.

Tipos de probabilidad en una tabla

Tipo Pregunta típica Forma de cálculo
Conjunta ¿Cuál es la probabilidad de que ocurra \(A\) y \(B\)? \(P(A\cap B)=\dfrac{|A\cap B|}{|S|}\)
Marginal ¿Cuál es la probabilidad de que ocurra \(A\)? \(P(A)=\dfrac{|A|}{|S|}\)
Condicional ¿Cuál es la probabilidad de que ocurra \(A\), sabiendo que ocurrió \(B\)? \(P(A\mid B)=\dfrac{|A\cap B|}{|B|}\)

Atención

El denominador cambia según el tipo de probabilidad.

  • En una probabilidad conjunta o marginal, normalmente se divide por el total general.
  • En una probabilidad condicional, se divide por el total del grupo condicionado.

Ejemplo 1: lectura conjunta, marginal y condicional

La siguiente tabla clasifica \(160\) parcelas experimentales según si usaron riego por goteo y si tuvieron producción alta.

  Producción alta Producción no alta Total
Con riego por goteo 54 26 80
Sin riego por goteo 32 48 80
Total 86 74 160

Probabilidad conjunta: que una parcela tenga riego por goteo y producción alta.

\[ P(\text{riego por goteo y producción alta})=\frac{54}{160}=\frac{27}{80} \]

Probabilidad marginal: que una parcela tenga producción alta.

\[ P(\text{producción alta})=\frac{86}{160}=\frac{43}{80} \]

Probabilidad condicional: que una parcela tenga producción alta, sabiendo que tuvo riego por goteo.

Ahora el universo de referencia son las \(80\) parcelas con riego por goteo:

\[ P(\text{producción alta}\mid \text{riego por goteo})=\frac{54}{80}=\frac{27}{40} \]

Ejemplo 2: distinguir el denominador correcto

La tabla muestra \(210\) muestras de alimentos según tipo de envase y si superaron una prueba de conservación.

Tipo de envase Superó prueba No superó prueba Total
Vidrio sellado 58 22 80
Bolsa sellada 47 33 80
Envase compostable 29 21 50
Total 134 76 210

Calculemos la probabilidad de que una muestra haya superado la prueba, sabiendo que usó envase compostable.

La condición es “envase compostable”, por lo que se consideran solo \(50\) muestras.

De esas \(50\), \(29\) superaron la prueba.

\[ P(\text{superó prueba}\mid \text{envase compostable})=\frac{29}{50} \]

No se divide por \(210\), porque la pregunta es condicional.

Ejemplo 3: comparar condicionales

En una evaluación de \(120\) rutas de evacuación se registró si estaban señalizadas y si fueron completadas en menos de \(4\) minutos durante un simulacro.

  Menos de \(4\) minutos \(4\) minutos o más Total
Señalizada 45 15 60
No señalizada 24 36 60
Total 69 51 120

Calculemos dos probabilidades condicionales distintas.

Primero, la probabilidad de que una ruta haya sido completada en menos de \(4\) minutos, sabiendo que estaba señalizada:

\[ P(\text{menos de }4\text{ min}\mid \text{señalizada})=\frac{45}{60}=\frac{3}{4} \]

Ahora, la probabilidad de que una ruta estuviera señalizada, sabiendo que fue completada en menos de \(4\) minutos:

\[ P(\text{señalizada}\mid \text{menos de }4\text{ min})=\frac{45}{69}=\frac{15}{23} \]

Aunque ambas usan la misma celda \(45\), el denominador cambia porque la condición cambia.

Ejemplo 4: completar una tabla antes de calcular

Una organización registró \(180\) participantes según si asistieron a una inducción y si aprobaron una evaluación inicial.

  Aprobó evaluación No aprobó evaluación Total
Asistió a inducción 72 28 100
No asistió a inducción 36 44 80
Total 108 72 180

La probabilidad marginal de aprobar la evaluación es:

\[ P(\text{aprobó})=\frac{108}{180}=\frac{3}{5} \]

La probabilidad conjunta de asistir a inducción y aprobar es:

\[ P(\text{inducción y aprobó})=\frac{72}{180}=\frac{2}{5} \]

La probabilidad condicional de aprobar sabiendo que asistió a inducción es:

\[ P(\text{aprobó}\mid \text{inducción})=\frac{72}{100}=\frac{18}{25} \]

Estrategia de lectura

  1. Lee la pregunta y decide si pide una probabilidad conjunta, marginal o condicional.
  2. Si aparece “y”, busca una celda interior.
  3. Si aparece solo una característica, busca un total de fila o columna.
  4. Si aparece “sabiendo que”, identifica el grupo condicionado y úsalo como denominador.
  5. Simplifica la fracción si corresponde.

Error común

Confundir una probabilidad conjunta con una condicional puede cambiar completamente el resultado.

Por ejemplo, \(\frac{54}{160}\) representa “riego por goteo y producción alta” respecto del total, mientras que \(\frac{54}{80}\) representa “producción alta sabiendo que hubo riego por goteo”.

Ejercicios

Ejercicio 1

La tabla clasifica \(180\) reactivos de laboratorio según si fueron almacenados en frío y si mantuvieron estabilidad química.

  Mantuvo estabilidad No mantuvo estabilidad Total
Almacenado en frío 68 22 90
No almacenado en frío 45 45 90
Total 113 67 180

Calcula:

  1. la probabilidad conjunta de que un reactivo haya sido almacenado en frío y mantuviera estabilidad;
  2. la probabilidad marginal de que un reactivo mantuviera estabilidad;
  3. la probabilidad condicional de que mantuviera estabilidad, sabiendo que fue almacenado en frío.

Ejercicio 2

La siguiente tabla muestra \(150\) registros de asistencia a sesiones de orientación académica.

Nivel Asistió a orientación No asistió Total
Primero medio 34 26 60
Segundo medio 28 22 50
Tercero medio 31 9 40
Total 93 57 150

Calcula la probabilidad de que un registro corresponda a tercero medio, sabiendo que asistió a orientación académica.

Ejercicio 3

Una base de \(240\) cursos en línea fue clasificada según duración y si entregan certificado.

Duración Con certificado Sin certificado Total
Corta 44 36 80
Media 58 42 100
Larga 39 21 60
Total 141 99 240

Calcula:

  1. \(P(\text{curso largo y con certificado})\);
  2. \(P(\text{con certificado})\);
  3. \(P(\text{curso largo}\mid \text{con certificado})\);
  4. \(P(\text{con certificado}\mid \text{curso largo})\).

Ejercicio 4

Se clasificaron \(300\) viajes interurbanos según horario de salida y puntualidad.

Horario Puntual Con retraso Total
Mañana 72 28 100
Tarde 65 35 100
Noche 48 52 100
Total 185 115 300

Una persona afirma que \(P(\text{mañana}\mid \text{puntual})=\frac{72}{100}\), porque hay \(100\) viajes de la mañana. ¿Es correcta su afirmación? Justifica y calcula la probabilidad correcta.

Ejercicio 5

La tabla muestra \(220\) solicitudes de soporte técnico según tipo de problema y si fueron resueltas en el primer contacto.

Tipo de problema Resuelta en primer contacto No resuelta en primer contacto Total
Acceso 38 22 60
Configuración 52 28 80
Funcionamiento 41 39 80
Total 131 89 220

Determina cuál de las siguientes probabilidades es mayor:

\[ P(\text{resuelta en primer contacto}\mid \text{configuración}) \]

o

\[ P(\text{resuelta en primer contacto}\mid \text{funcionamiento}) \]

Ejercicio 6

La siguiente tabla está incompleta. Se clasificaron \(180\) participantes según si usaron guía de estudio y si aprobaron una prueba diagnóstica.

  Aprobó No aprobó Total
Usó guía 64 26 90
No usó guía 38 52 90
Total 102 78 180

Calcula la probabilidad de que una persona haya usado guía, sabiendo que aprobó la prueba diagnóstica. Luego calcula la probabilidad de que haya aprobado, sabiendo que usó guía.

Problemas tipo PAES

Problema 1

La tabla clasifica \(250\) análisis de aire según zona y nivel de material particulado.

Zona Nivel alto Nivel moderado Nivel bajo Total
Norte 28 32 20 80
Centro 45 39 16 100
Sur 21 27 22 70
Total 94 98 58 250

Si se sabe que un análisis corresponde a la zona centro, ¿cuál es la probabilidad de que tenga nivel alto?

A) \(\frac{45}{250}\)

B) \(\frac{45}{100}\)

C) \(\frac{94}{250}\)

D) \(\frac{100}{250}\)

Problema 2

En una tabla de contingencia con total general \(N=400\), una celda interior tiene valor \(72\). ¿Qué representa \(\frac{72}{400}\)?

A) Una probabilidad conjunta.

B) Una probabilidad condicional.

C) Una frecuencia marginal.

D) Un total por fila.

Problema 3

La tabla clasifica \(180\) proyectos según área y si fueron financiados.

Área Financiado No financiado Total
Medio ambiente 36 24 60
Tecnología social 42 38 80
Patrimonio 18 22 40
Total 96 84 180

¿Cuál es la probabilidad marginal de que un proyecto haya sido financiado?

A) \(\frac{36}{180}\)

B) \(\frac{96}{180}\)

C) \(\frac{36}{60}\)

D) \(\frac{96}{60}\)

Problema 4

En una tabla de contingencia se estudian dos eventos \(A\) y \(B\). Se sabe que \(|A\cap B|=54\), \(|B|=90\) y \(|S|=240\). ¿Cuál expresión representa \(P(A\mid B)\)?

A) \(\frac{54}{240}\)

B) \(\frac{90}{240}\)

C) \(\frac{54}{90}\)

D) \(\frac{90}{54}\)

Problema 5

La tabla clasifica \(320\) observaciones de fauna según horario y tipo de registro.

Horario Registro visual Registro auditivo Total
Amanecer 58 42 100
Tarde 64 56 120
Noche 36 64 100
Total 158 162 320

¿Cuál de las siguientes probabilidades es mayor?

A) \(P(\text{registro visual}\mid \text{amanecer})\)

B) \(P(\text{registro visual}\mid \text{tarde})\)

C) \(P(\text{registro visual}\mid \text{noche})\)

D) Las tres son iguales.