GPT-4在循环与呼吸系统解剖学考试模型构建中的应用评估：基于布鲁姆修订分类法的医学教育研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月11日 来源：Surgical and Radiologic Anatomy 1.2

编辑推荐：

　　为解决医学教育中高质量解剖学试题生成的效率与认知层次匹配问题，研究人员利用GPT-4开发了240道基于布鲁姆修订分类法(Bloom’s revised taxonomy)的多选题(MCQs)，并通过280名医学生的测试验证其有效性。结果显示试题平均难度指数0.5012、KR-20信度0.737，但专家对AI题目分类一致性仅26.6%，提示GPT-4在评估高阶认知能力方面存在局限，为AI辅助医学教育评估提供了重要实证依据。

这项开创性研究探索了GPT-4在构建循环与呼吸系统解剖学考试模型中的潜力。科研团队采用人工智能生成240道多选题(MCQs)，严格遵循布鲁姆修订分类法(Bloom’s revised taxonomy)的认知层次框架。在试题设计过程中，精心编排的提示词(prompt)融入了课程目标、学习重点和学生背景等关键要素。

从题库中随机抽取30道题目对280名医学生进行测试，结果显示：考试中位数得分50分(范围36.67-60)，整体难度系数0.5012达到理想水平，KR-20信度系数0.737表明试题具有良好内部一致性。有趣的是，虽然80.9%的考生认为题目表述清晰，85.8%愿意再次参加同类考试，但解剖学专家对AI生成题目的认知层次分类与GPT-4预设仅26.6%吻合。

该研究证实GPT-4能高效生成基础知识点考查题目，但在评估分析、评价等高阶认知能力(Cognitive Process Dimension)方面表现欠佳。研究者建议未来开发结合专家审核与多模态AI的混合式评估系统，为智能时代医学教育改革提供了重要启示。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号