临床实习考核表对医学生表现的预测效度研究：基于帝国理工学院的实证分析

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《BMC Medical Education》：What is the predictive validity of clinical placement sign-off forms for medical students?

【字体：大中小】 时间：2025年06月06日 来源：BMC Medical Education 2.7

编辑推荐：

　　本研究针对医学生临床实习考核表(sign-off forms)的预测效度问题，通过对比帝国理工学院355名三年级医学生的实习评分与年终考试(SBAQ/OSCE)成绩，发现除全科医生(GP)对临床技能(CS)的弱相关性外，医院实习评分对考试表现无显著预测价值(r2 =0.02)，提示现行考核体系需引入多源反馈(MSF)和嵌入式评估。

在医学教育领域，临床实习考核表(sign-off forms)长期作为评估医学生临床能力的主要工具，但其科学性和有效性一直备受争议。随着现代医学教育转向短期轮转模式，学生与导师的接触时间大幅减少，这种"一锤定音"式的评估能否真实反映学生能力？帝国理工学院的研究团队在《BMC Medical Education》发表的研究成果，为这一争议提供了重要证据。

研究背景凸显三大矛盾：一是临床评估的高风险性（关乎患者安全和学生职业生涯）与评估方式的随意性之间的矛盾；二是现代医学教育"多而短"的轮转特点（如8周GP实习 vs 4周专科轮转）与传统评估要求持续观察之间的矛盾；三是标准化考试（如OSCE和SBAQ）的客观性与主观评分的模糊性之间的矛盾。这些问题直接影响了医学教育的质量和公平性。

为系统评估临床考核表的预测效度，帝国理工学院Patrick J McGown团队开展了一项大样本回顾性研究。研究纳入2021-22学年全部355名三年级医学生数据，涵盖内科、外科和GP三个轮转单元。通过普通最小二乘法(OLS)回归分析，比较临床评分（知识K、临床技能CS、实践技能PS）与年终考试成绩的关联性。

关键技术方法包括：1)使用机构标准化sign-off表单（4级评分制）；2)采集SBAQ（150题）和OSCE（12站）的百分制成绩；3)通过Kendall's tau-b检验评估评分维度相关性；4)采用Holm校正控制多重比较误差；5)运用ANOVA分析轮转顺序对成绩的影响。所有数据均通过帝国理工学院教育伦理委员会(EERP2223-060)审批。

研究结果呈现四大发现：

"评分维度高度相关"
数据显示各临床评分维度间存在强相关性（τ=0.587-0.744，p<0.0001），提示可能存在"光环效应"——导师倾向于给出整体性评价而非区分具体能力维度。

"GP评估的微弱预测性"
全科医生对临床技能(CS)的评分与OSCE成绩存在统计学显著但教育意义有限的关联（β=1.76%，p=0.012，r²
=0.02）。这意味着即使最相关的评分也只能解释2%的考试变异。

"医院评估的预测失效"
内科和外科导师的所有评分（包括知识K）与对应专科SBAQ成绩均无显著相关性（p>0.008），推翻"临床观察能预测理论考试"的传统假设。

"轮转时序无关性"
令人意外的是，无论是临床评分（χ²
<1.13，p>0.28）还是考试成绩（F<4.35，p>0.014）均不受轮转顺序影响，表明学生表现保持稳定或评估标准随学期调整。

讨论部分提出三重革新建议：首先，针对GP与医院环境差异（前者纵向观察、后者碎片化评估），应制定差异化考核标准；其次，引入多源反馈(MSF)机制，整合住院医师等更多观察者的评价；最后，增加嵌入式评估（如轮转中OSCE），通过多时间点采样提高信度。

这项研究的重要价值在于：首次大规模验证临床考核表在当代医学教育中的局限性，为全球医学院校改革评估体系提供了实证依据。特别是发现GP与医院评估的差异性，提示需要根据临床环境特点"量体裁衣"设计评估工具。正如作者强调，在保证患者安全与教育公平的前提下，如何平衡评估的可行性(Feasibility)与效度(Validity)，将是未来医学教育研究的关键方向。

联系信箱：

粤ICP备09063491号

热点排行