针对本科医学生的概率推理测试的开发与有效性验证证据

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《BMC Medical Education》：Development and validity evidence for the probabilistic reasoning test in undergraduate medical students

【字体：大中小】 时间：2026年06月10日 来源：BMC Medical Education 3.2

编辑推荐：

　　摘要背景脚本一致性测试（SCT）被广泛用于医学教育中评估临床推理能力，但其在高风险考试中的使用引发了一些问题，这些问题包括答案的模糊性、对专家小组的依赖以及学生对其接受度的有限性。为了解决这些问题，我们开发了概率推理测试（PRT），这是一种简化版的测试格式，旨在通过单一的预设正确

摘要

背景

脚本一致性测试（SCT）被广泛用于医学教育中评估临床推理能力，但其在高风险考试中的使用引发了一些问题，这些问题包括答案的模糊性、对专家小组的依赖以及学生对其接受度的有限性。为了解决这些问题，我们开发了概率推理测试（PRT），这是一种简化版的测试格式，旨在通过单一的预设正确答案和三点评分量表来评估临床场景中的规范性概率推理。

方法

我们进行了一项研究，参与者包括五年级的医学生、儿科住院医师和儿科医生。他们完成了基于相同临床场景的SCT、PRT和多项选择题（MCQ）的匹配组合。同时收集了学生的客观结构化临床考试（OSCE）成绩。研究结果包括SCT和PRT答案之间的一致性、两种测试形式的内部一致性、与其他评估方式的关系、不同经验水平下的分数解释以及参与者的接受度。

结果

共有575名参与者接受了分析（538名学生、19名住院医师、18名儿科医生）。SCT和PRT答案之间的一致性很高（一致性为91.4%，加权κ值=0.91）。两种测试形式的内部一致性都较为适中（PRT的Cronbach’s α值为0.63；SCT为0.62）。PRT分数与SCT分数的相关性很强，与MCQ分数的相关性为中等，与OSCE分数的相关性较弱（p<0.05）。与SCT不同，PRT在区分临床经验水平方面没有显著差异。参与者对PRT的满意度普遍更高，有90%的参与者更倾向于在考试中使用PRT。

结论

研究表明，PRT与SCT在结果上具有很强的方向一致性，并且在本科教学环境中更受学生欢迎，但在区分不同经验水平方面的能力有限。它可能是一种适用于本科阶段规范性概率推理总结性评估的实用测试格式。

背景

脚本一致性测试（SCT）被广泛用于医学教育中评估临床推理能力，但其在高风险考试中的使用引发了一些问题，这些问题包括答案的模糊性、对专家小组的依赖以及学生对其接受度的有限性。为了解决这些问题，我们开发了概率推理测试（PRT），这是一种简化版的测试格式，旨在通过单一的预设正确答案和三点评分量表来评估临床场景中的规范性概率推理。

方法

我们进行了一项研究，参与者包括五年级的医学生、儿科住院医师和儿科医生。他们完成了基于相同临床场景的SCT、PRT和多项选择题（MCQ）的匹配组合。同时收集了学生的客观结构化临床考试（OSCE）成绩。研究结果包括SCT和PRT答案之间的一致性、两种测试形式的内部一致性、与其他评估方式的关系、不同经验水平下的分数解释以及参与者的接受度。

结果

共有575名参与者接受了分析（538名学生、19名住院医师、18名儿科医生）。SCT和PRT答案之间的一致性很高（一致性为91.4%，加权κ值=0.91）。两种测试形式的内部一致性都较为适中（PRT的Cronbach’s α值为0.63；SCT为0.62）。PRT分数与SCT分数的相关性很强，与MCQ分数的相关性为中等，与OSCE分数的相关性较弱（p<0.05）。与SCT不同，PRT在区分临床经验水平方面没有显著差异。参与者对PRT的满意度普遍更高，有90%的参与者更倾向于在考试中使用PRT。

结论

研究表明，PRT与SCT在结果上具有很强的方向一致性，并且在本科教学环境中更受学生欢迎，但在区分不同经验水平方面的能力有限。它可能是一种适用于本科阶段规范性概率推理总结性评估的实用测试格式。

联系信箱：

粤ICP备09063491号

摘要

背景

方法

结果

结论

背景

方法

结果

结论

热点排行