GUIA post evalua
Requisitos de finalización
Guía para el Análisis de Pruebas y Detección de Copias
¿Por qué analizar evaluaciones?
El análisis de pruebas permite diagnosticar la calidad de las preguntas, la coherencia del instrumento y la honestidad académica. Así puedes mejorar tu práctica docente y entregar retroalimentación objetiva.
El análisis de pruebas permite diagnosticar la calidad de las preguntas, la coherencia del instrumento y la honestidad académica. Así puedes mejorar tu práctica docente y entregar retroalimentación objetiva.
Nota: este software es exclusivo para evaluaciones de items de selección única
1. Detección de Copias
El análisis de copias identifica pares de estudiantes cuyas respuestas incorrectas coinciden más de lo esperable al azar. El algoritmo:
- Cuenta K: número de preguntas donde ambos dan la misma respuesta y esa respuesta es incorrecta.
- Calcula la probabilidad (p-valor) de observar K o más coincidencias si respondieran al azar.
- Si el p-valor es muy bajo (p. < 0.01), el par se marca como sospechoso.
Ejemplo: Dos alumnos coinciden en 4 errores idénticos sobre 10 preguntas con 4 alternativas; el p-valor clásico es 0.0008. La baja probabilidad indica posible copia.
Nota: Coincidencias en aciertos (K = 0) no generan sospecha; el modelo solo considera respuestas incorrectas coincidentes.
2. Alfa de Cronbach: ¿La prueba es confiable?
El alfa de Cronbach mide la consistencia interna de toda la prueba. Un valor alto (por ejemplo > 0.8) indica una prueba confiable; un valor bajo (< 0.7) sugiere revisar el instrumento o sus ítems.
Ejemplo: Una prueba con alfa = 0.92 es altamente confiable. Si el alfa aumenta al eliminar un ítem, ese ítem introduce ruido; si disminuye, el ítem aporta coherencia.
3. Dificultad de los ítems
La dificultad es el porcentaje de aciertos de un ítem.
• > 0.8 ⇒ muy fácil • < 0.3 ⇒ muy difícil • 0.3 – 0.8 ⇒ rango óptimo.
Ejemplo: 12 de 20 estudiantes aciertan → dificultad = 0.6 (60 %).
4. Discriminación de los ítems
La discriminación evalúa cómo un ítem distingue entre estudiantes de alto y bajo desempeño (grupos ~27 %).
• ≈ 1 ⇒ excelente • ≈ 0 ⇒ nula • < 0 ⇒ ítem problemático.
Ejemplo: Grupo superior acierta 90 %, grupo inferior 40 % → discriminación = 0.50.
5. Ejemplo Integrado
Respuestas de 10 estudiantes en una prueba de 6 preguntas:
Est. | P1 | P2 | P3 | P4 | P5 | P6 |
---|---|---|---|---|---|---|
A | A | B | D | C | B | D |
B | A | B | D | C | B | D |
C | A | B | D | C | A | D |
D | A | B | C | C | B | D |
E | A | C | D | D | B | D |
F | D | C | B | D | C | C |
G | D | C | B | D | C | C |
H | D | C | B | D | C | D |
I | D | B | D | D | B | C |
J | B | B | D | C | C | D |
- Claves correctas: A B D C B D
- Dificultad por ítem: P1 0.50, P2 0.60, P3 0.60, P4 0.50, P5 0.50, P6 0.70
- Discriminación (grupo 27 % sup vs inf): P1 1.00, P2 1.00, P3 1.00, P4 1.00, P5 0.67, P6 0.67
- Alfa de Cronbach: 0.88 (buena confiabilidad)
- Pares sospechosos: F – G comparten 6 errores idénticos → p ≈ 0.0002
6. Recomendaciones para el docente
- Ítems muy fáciles/difíciles: revisar su alineación curricular.
- Baja o negativa discriminación: comprobar redacción, clave y distractores.
- Alfa de Cronbach bajo: ver si la prueba mezcla habilidades distintas o si hay ítems ruidosos.
- Pares sospechosos: revisar condiciones de aplicación y conversar con los estudiantes.
7. Glosario rápido
Dificultad: % de aciertos por ítem.
Discriminación: Diferencia de aciertos entre mejores y peores.
Alfa de Cronbach: Consistencia interna global.
p-valor: Probabilidad de coincidencia azarosa.
Ítem: Pregunta individual.
Discriminación: Diferencia de aciertos entre mejores y peores.
Alfa de Cronbach: Consistencia interna global.
p-valor: Probabilidad de coincidencia azarosa.
Ítem: Pregunta individual.
Material elaborado por Profe Arauco. Puedes compartir este recurso con atribución.
Última modificación: miércoles, 25 de junio de 2025, 19:08