
-
生物通官微
陪你抓住生命科技
跳动的脉搏
临床实习考核表对医学生表现的预测效度研究:基于帝国理工学院的实证分析
【字体: 大 中 小 】 时间:2025年06月06日 来源:BMC Medical Education 2.7
编辑推荐:
本研究针对医学生临床实习考核表(sign-off forms)的预测效度问题,通过对比帝国理工学院355名三年级医学生的实习评分与年终考试(SBAQ/OSCE)成绩,发现除全科医生(GP)对临床技能(CS)的弱相关性外,医院实习评分对考试表现无显著预测价值(r2 =0.02),提示现行考核体系需引入多源反馈(MSF)和嵌入式评估。
在医学教育领域,临床实习考核表(sign-off forms)长期作为评估医学生临床能力的主要工具,但其科学性和有效性一直备受争议。随着现代医学教育转向短期轮转模式,学生与导师的接触时间大幅减少,这种"一锤定音"式的评估能否真实反映学生能力?帝国理工学院的研究团队在《BMC Medical Education》发表的研究成果,为这一争议提供了重要证据。
研究背景凸显三大矛盾:一是临床评估的高风险性(关乎患者安全和学生职业生涯)与评估方式的随意性之间的矛盾;二是现代医学教育"多而短"的轮转特点(如8周GP实习 vs 4周专科轮转)与传统评估要求持续观察之间的矛盾;三是标准化考试(如OSCE和SBAQ)的客观性与主观评分的模糊性之间的矛盾。这些问题直接影响了医学教育的质量和公平性。
为系统评估临床考核表的预测效度,帝国理工学院Patrick J McGown团队开展了一项大样本回顾性研究。研究纳入2021-22学年全部355名三年级医学生数据,涵盖内科、外科和GP三个轮转单元。通过普通最小二乘法(OLS)回归分析,比较临床评分(知识K、临床技能CS、实践技能PS)与年终考试成绩的关联性。
关键技术方法包括:1)使用机构标准化sign-off表单(4级评分制);2)采集SBAQ(150题)和OSCE(12站)的百分制成绩;3)通过Kendall's tau-b检验评估评分维度相关性;4)采用Holm校正控制多重比较误差;5)运用ANOVA分析轮转顺序对成绩的影响。所有数据均通过帝国理工学院教育伦理委员会(EERP2223-060)审批。
研究结果呈现四大发现:
"评分维度高度相关"
数据显示各临床评分维度间存在强相关性(τ=0.587-0.744,p<0.0001),提示可能存在"光环效应"——导师倾向于给出整体性评价而非区分具体能力维度。
"GP评估的微弱预测性"
全科医生对临床技能(CS)的评分与OSCE成绩存在统计学显著但教育意义有限的关联(β=1.76%,p=0.012,r2
=0.02)。这意味着即使最相关的评分也只能解释2%的考试变异。
"医院评估的预测失效"
内科和外科导师的所有评分(包括知识K)与对应专科SBAQ成绩均无显著相关性(p>0.008),推翻"临床观察能预测理论考试"的传统假设。
"轮转时序无关性"
令人意外的是,无论是临床评分(χ2
<1.13,p>0.28)还是考试成绩(F<4.35,p>0.014)均不受轮转顺序影响,表明学生表现保持稳定或评估标准随学期调整。
讨论部分提出三重革新建议:首先,针对GP与医院环境差异(前者纵向观察、后者碎片化评估),应制定差异化考核标准;其次,引入多源反馈(MSF)机制,整合住院医师等更多观察者的评价;最后,增加嵌入式评估(如轮转中OSCE),通过多时间点采样提高信度。
这项研究的重要价值在于:首次大规模验证临床考核表在当代医学教育中的局限性,为全球医学院校改革评估体系提供了实证依据。特别是发现GP与医院评估的差异性,提示需要根据临床环境特点"量体裁衣"设计评估工具。正如作者强调,在保证患者安全与教育公平的前提下,如何平衡评估的可行性(Feasibility)与效度(Validity),将是未来医学教育研究的关键方向。
生物通微信公众号
知名企业招聘