Probabilidad básica
12. Tablas de contingencia: condicionales, marginales y conjuntas
Objetivo de aprendizaje
- Calcular e interpretar probabilidades conjuntas, marginales y condicionales a partir de tablas de contingencia.
Tres lecturas de una misma tabla
Una tabla de contingencia permite estudiar dos características al mismo tiempo. A partir de ella se pueden obtener tres tipos de probabilidades:
- Probabilidad conjunta: considera dos condiciones simultáneamente.
- Probabilidad marginal: considera una sola característica, usando un total de fila o columna.
- Probabilidad condicional: considera una característica sabiendo que otra ya ocurrió.
Tipos de probabilidad en una tabla
| Tipo | Pregunta típica | Forma de cálculo |
|---|---|---|
| Conjunta | ¿Cuál es la probabilidad de que ocurra \(A\) y \(B\)? | \(P(A\cap B)=\dfrac{|A\cap B|}{|S|}\) |
| Marginal | ¿Cuál es la probabilidad de que ocurra \(A\)? | \(P(A)=\dfrac{|A|}{|S|}\) |
| Condicional | ¿Cuál es la probabilidad de que ocurra \(A\), sabiendo que ocurrió \(B\)? | \(P(A\mid B)=\dfrac{|A\cap B|}{|B|}\) |
Atención
El denominador cambia según el tipo de probabilidad.
- En una probabilidad conjunta o marginal, normalmente se divide por el total general.
- En una probabilidad condicional, se divide por el total del grupo condicionado.
Ejemplo 1: lectura conjunta, marginal y condicional
La siguiente tabla clasifica \(160\) parcelas experimentales según si usaron riego por goteo y si tuvieron producción alta.
| Producción alta | Producción no alta | Total | |
|---|---|---|---|
| Con riego por goteo | 54 | 26 | 80 |
| Sin riego por goteo | 32 | 48 | 80 |
| Total | 86 | 74 | 160 |
Probabilidad conjunta: que una parcela tenga riego por goteo y producción alta.
\[ P(\text{riego por goteo y producción alta})=\frac{54}{160}=\frac{27}{80} \]
Probabilidad marginal: que una parcela tenga producción alta.
\[ P(\text{producción alta})=\frac{86}{160}=\frac{43}{80} \]
Probabilidad condicional: que una parcela tenga producción alta, sabiendo que tuvo riego por goteo.
Ahora el universo de referencia son las \(80\) parcelas con riego por goteo:
\[ P(\text{producción alta}\mid \text{riego por goteo})=\frac{54}{80}=\frac{27}{40} \]
Ejemplo 2: distinguir el denominador correcto
La tabla muestra \(210\) muestras de alimentos según tipo de envase y si superaron una prueba de conservación.
| Tipo de envase | Superó prueba | No superó prueba | Total |
|---|---|---|---|
| Vidrio sellado | 58 | 22 | 80 |
| Bolsa sellada | 47 | 33 | 80 |
| Envase compostable | 29 | 21 | 50 |
| Total | 134 | 76 | 210 |
Calculemos la probabilidad de que una muestra haya superado la prueba, sabiendo que usó envase compostable.
La condición es “envase compostable”, por lo que se consideran solo \(50\) muestras.
De esas \(50\), \(29\) superaron la prueba.
\[ P(\text{superó prueba}\mid \text{envase compostable})=\frac{29}{50} \]
No se divide por \(210\), porque la pregunta es condicional.
Ejemplo 3: comparar condicionales
En una evaluación de \(120\) rutas de evacuación se registró si estaban señalizadas y si fueron completadas en menos de \(4\) minutos durante un simulacro.
| Menos de \(4\) minutos | \(4\) minutos o más | Total | |
|---|---|---|---|
| Señalizada | 45 | 15 | 60 |
| No señalizada | 24 | 36 | 60 |
| Total | 69 | 51 | 120 |
Calculemos dos probabilidades condicionales distintas.
Primero, la probabilidad de que una ruta haya sido completada en menos de \(4\) minutos, sabiendo que estaba señalizada:
\[ P(\text{menos de }4\text{ min}\mid \text{señalizada})=\frac{45}{60}=\frac{3}{4} \]
Ahora, la probabilidad de que una ruta estuviera señalizada, sabiendo que fue completada en menos de \(4\) minutos:
\[ P(\text{señalizada}\mid \text{menos de }4\text{ min})=\frac{45}{69}=\frac{15}{23} \]
Aunque ambas usan la misma celda \(45\), el denominador cambia porque la condición cambia.
Ejemplo 4: completar una tabla antes de calcular
Una organización registró \(180\) participantes según si asistieron a una inducción y si aprobaron una evaluación inicial.
| Aprobó evaluación | No aprobó evaluación | Total | |
|---|---|---|---|
| Asistió a inducción | 72 | 28 | 100 |
| No asistió a inducción | 36 | 44 | 80 |
| Total | 108 | 72 | 180 |
La probabilidad marginal de aprobar la evaluación es:
\[ P(\text{aprobó})=\frac{108}{180}=\frac{3}{5} \]
La probabilidad conjunta de asistir a inducción y aprobar es:
\[ P(\text{inducción y aprobó})=\frac{72}{180}=\frac{2}{5} \]
La probabilidad condicional de aprobar sabiendo que asistió a inducción es:
\[ P(\text{aprobó}\mid \text{inducción})=\frac{72}{100}=\frac{18}{25} \]
Estrategia de lectura
- Lee la pregunta y decide si pide una probabilidad conjunta, marginal o condicional.
- Si aparece “y”, busca una celda interior.
- Si aparece solo una característica, busca un total de fila o columna.
- Si aparece “sabiendo que”, identifica el grupo condicionado y úsalo como denominador.
- Simplifica la fracción si corresponde.
Error común
Confundir una probabilidad conjunta con una condicional puede cambiar completamente el resultado.
Por ejemplo, \(\frac{54}{160}\) representa “riego por goteo y producción alta” respecto del total, mientras que \(\frac{54}{80}\) representa “producción alta sabiendo que hubo riego por goteo”.
Ejercicios
Ejercicio 1
La tabla clasifica \(180\) reactivos de laboratorio según si fueron almacenados en frío y si mantuvieron estabilidad química.
| Mantuvo estabilidad | No mantuvo estabilidad | Total | |
|---|---|---|---|
| Almacenado en frío | 68 | 22 | 90 |
| No almacenado en frío | 45 | 45 | 90 |
| Total | 113 | 67 | 180 |
Calcula:
- la probabilidad conjunta de que un reactivo haya sido almacenado en frío y mantuviera estabilidad;
- la probabilidad marginal de que un reactivo mantuviera estabilidad;
- la probabilidad condicional de que mantuviera estabilidad, sabiendo que fue almacenado en frío.
La frecuencia conjunta “almacenado en frío y mantuvo estabilidad” es \(68\). Entonces:
\[ P(\text{frío y estable})=\frac{68}{180}=\frac{17}{45} \]
El total de reactivos que mantuvieron estabilidad es \(113\). Entonces:
\[ P(\text{estable})=\frac{113}{180} \]
Para la probabilidad condicional, el universo de referencia son los \(90\) reactivos almacenados en frío. De ellos, \(68\) mantuvieron estabilidad:
\[ P(\text{estable}\mid \text{frío})=\frac{68}{90}=\frac{34}{45} \]
Ejercicio 2
La siguiente tabla muestra \(150\) registros de asistencia a sesiones de orientación académica.
| Nivel | Asistió a orientación | No asistió | Total |
|---|---|---|---|
| Primero medio | 34 | 26 | 60 |
| Segundo medio | 28 | 22 | 50 |
| Tercero medio | 31 | 9 | 40 |
| Total | 93 | 57 | 150 |
Calcula la probabilidad de que un registro corresponda a tercero medio, sabiendo que asistió a orientación académica.
La condición es “asistió a orientación académica”. Por lo tanto, se consideran los \(93\) registros de esa columna.
Dentro de esos \(93\), \(31\) corresponden a tercero medio.
Entonces:
\[ P(\text{tercero medio}\mid \text{asistió})=\frac{31}{93}=\frac{1}{3} \]
Ejercicio 3
Una base de \(240\) cursos en línea fue clasificada según duración y si entregan certificado.
| Duración | Con certificado | Sin certificado | Total |
|---|---|---|---|
| Corta | 44 | 36 | 80 |
| Media | 58 | 42 | 100 |
| Larga | 39 | 21 | 60 |
| Total | 141 | 99 | 240 |
Calcula:
- \(P(\text{curso largo y con certificado})\);
- \(P(\text{con certificado})\);
- \(P(\text{curso largo}\mid \text{con certificado})\);
- \(P(\text{con certificado}\mid \text{curso largo})\).
La frecuencia conjunta “curso largo y con certificado” es \(39\):
\[ P(\text{largo y certificado})=\frac{39}{240}=\frac{13}{80} \]
El total de cursos con certificado es \(141\):
\[ P(\text{con certificado})=\frac{141}{240}=\frac{47}{80} \]
Para \(P(\text{curso largo}\mid \text{con certificado})\), el denominador es \(141\):
\[ P(\text{largo}\mid \text{certificado})=\frac{39}{141}=\frac{13}{47} \]
Para \(P(\text{con certificado}\mid \text{curso largo})\), el denominador es \(60\):
\[ P(\text{certificado}\mid \text{largo})=\frac{39}{60}=\frac{13}{20} \]
Ejercicio 4
Se clasificaron \(300\) viajes interurbanos según horario de salida y puntualidad.
| Horario | Puntual | Con retraso | Total |
|---|---|---|---|
| Mañana | 72 | 28 | 100 |
| Tarde | 65 | 35 | 100 |
| Noche | 48 | 52 | 100 |
| Total | 185 | 115 | 300 |
Una persona afirma que \(P(\text{mañana}\mid \text{puntual})=\frac{72}{100}\), porque hay \(100\) viajes de la mañana. ¿Es correcta su afirmación? Justifica y calcula la probabilidad correcta.
La afirmación no es correcta.
En \(P(\text{mañana}\mid \text{puntual})\), la condición es “puntual”. Por lo tanto, el denominador debe ser el total de viajes puntuales, que es \(185\), no el total de viajes de la mañana.
De los \(185\) viajes puntuales, \(72\) fueron en la mañana.
Entonces:
\[ P(\text{mañana}\mid \text{puntual})=\frac{72}{185} \]
El error fue usar como denominador el total de la fila en vez del total del grupo condicionado.
Ejercicio 5
La tabla muestra \(220\) solicitudes de soporte técnico según tipo de problema y si fueron resueltas en el primer contacto.
| Tipo de problema | Resuelta en primer contacto | No resuelta en primer contacto | Total |
|---|---|---|---|
| Acceso | 38 | 22 | 60 |
| Configuración | 52 | 28 | 80 |
| Funcionamiento | 41 | 39 | 80 |
| Total | 131 | 89 | 220 |
Determina cuál de las siguientes probabilidades es mayor:
\[ P(\text{resuelta en primer contacto}\mid \text{configuración}) \]
o
\[ P(\text{resuelta en primer contacto}\mid \text{funcionamiento}) \]
Para problemas de configuración:
\[ P(\text{resuelta}\mid \text{configuración})=\frac{52}{80}=\frac{13}{20}=0{,}65 \]
Para problemas de funcionamiento:
\[ P(\text{resuelta}\mid \text{funcionamiento})=\frac{41}{80}=0{,}5125 \]
Como \(0{,}65>0{,}5125\), es mayor la probabilidad de resolución en primer contacto sabiendo que el problema era de configuración.
Ejercicio 6
La siguiente tabla está incompleta. Se clasificaron \(180\) participantes según si usaron guía de estudio y si aprobaron una prueba diagnóstica.
| Aprobó | No aprobó | Total | |
|---|---|---|---|
| Usó guía | 64 | 26 | 90 |
| No usó guía | 38 | 52 | 90 |
| Total | 102 | 78 | 180 |
Calcula la probabilidad de que una persona haya usado guía, sabiendo que aprobó la prueba diagnóstica. Luego calcula la probabilidad de que haya aprobado, sabiendo que usó guía.
Para \(P(\text{usó guía}\mid \text{aprobó})\), la condición es “aprobó”. Hay \(102\) personas que aprobaron y \(64\) de ellas usaron guía.
\[ P(\text{usó guía}\mid \text{aprobó})=\frac{64}{102}=\frac{32}{51} \]
Para \(P(\text{aprobó}\mid \text{usó guía})\), la condición es “usó guía”. Hay \(90\) personas que usaron guía y \(64\) aprobaron.
\[ P(\text{aprobó}\mid \text{usó guía})=\frac{64}{90}=\frac{32}{45} \]
Las fracciones son distintas porque se cambia el universo de referencia.
Problemas tipo PAES
Problema 1
La tabla clasifica \(250\) análisis de aire según zona y nivel de material particulado.
| Zona | Nivel alto | Nivel moderado | Nivel bajo | Total |
|---|---|---|---|---|
| Norte | 28 | 32 | 20 | 80 |
| Centro | 45 | 39 | 16 | 100 |
| Sur | 21 | 27 | 22 | 70 |
| Total | 94 | 98 | 58 | 250 |
Si se sabe que un análisis corresponde a la zona centro, ¿cuál es la probabilidad de que tenga nivel alto?
A) \(\frac{45}{250}\)
B) \(\frac{45}{100}\)
C) \(\frac{94}{250}\)
D) \(\frac{100}{250}\)
La condición es “zona centro”, por lo que el denominador es \(100\).
Dentro de los análisis de la zona centro, \(45\) tienen nivel alto.
Entonces:
\[ P(\text{nivel alto}\mid \text{centro})=\frac{45}{100} \]
La alternativa correcta es B.
Problema 2
En una tabla de contingencia con total general \(N=400\), una celda interior tiene valor \(72\). ¿Qué representa \(\frac{72}{400}\)?
A) Una probabilidad conjunta.
B) Una probabilidad condicional.
C) Una frecuencia marginal.
D) Un total por fila.
Una celda interior representa una frecuencia conjunta.
Al dividir esa frecuencia conjunta por el total general, se obtiene una probabilidad conjunta.
Por lo tanto, \(\frac{72}{400}\) representa una probabilidad conjunta.
La alternativa correcta es A.
Problema 3
La tabla clasifica \(180\) proyectos según área y si fueron financiados.
| Área | Financiado | No financiado | Total |
|---|---|---|---|
| Medio ambiente | 36 | 24 | 60 |
| Tecnología social | 42 | 38 | 80 |
| Patrimonio | 18 | 22 | 40 |
| Total | 96 | 84 | 180 |
¿Cuál es la probabilidad marginal de que un proyecto haya sido financiado?
A) \(\frac{36}{180}\)
B) \(\frac{96}{180}\)
C) \(\frac{36}{60}\)
D) \(\frac{96}{60}\)
La probabilidad marginal de que un proyecto haya sido financiado usa el total de la columna “Financiado”.
Ese total es \(96\), y el total general es \(180\).
Entonces:
\[ P(\text{financiado})=\frac{96}{180} \]
La alternativa correcta es B.
Problema 4
En una tabla de contingencia se estudian dos eventos \(A\) y \(B\). Se sabe que \(|A\cap B|=54\), \(|B|=90\) y \(|S|=240\). ¿Cuál expresión representa \(P(A\mid B)\)?
A) \(\frac{54}{240}\)
B) \(\frac{90}{240}\)
C) \(\frac{54}{90}\)
D) \(\frac{90}{54}\)
La probabilidad condicional se calcula como:
\[ P(A\mid B)=\frac{|A\cap B|}{|B|} \]
Reemplazando:
\[ P(A\mid B)=\frac{54}{90} \]
La alternativa correcta es C.
Problema 5
La tabla clasifica \(320\) observaciones de fauna según horario y tipo de registro.
| Horario | Registro visual | Registro auditivo | Total |
|---|---|---|---|
| Amanecer | 58 | 42 | 100 |
| Tarde | 64 | 56 | 120 |
| Noche | 36 | 64 | 100 |
| Total | 158 | 162 | 320 |
¿Cuál de las siguientes probabilidades es mayor?
A) \(P(\text{registro visual}\mid \text{amanecer})\)
B) \(P(\text{registro visual}\mid \text{tarde})\)
C) \(P(\text{registro visual}\mid \text{noche})\)
D) Las tres son iguales.
Calculamos cada probabilidad condicional:
\[ P(\text{visual}\mid \text{amanecer})=\frac{58}{100}=0{,}58 \]
\[ P(\text{visual}\mid \text{tarde})=\frac{64}{120}=\frac{8}{15}\approx 0{,}533 \]
\[ P(\text{visual}\mid \text{noche})=\frac{36}{100}=0{,}36 \]
La mayor probabilidad es \(P(\text{registro visual}\mid \text{amanecer})\).
La alternativa correcta es A.
