GPT-4 为医学本科教育选择题生成答案解析:可行性与应用前景

【字体: 时间:2025年03月05日 来源:BMC Medical Education 2.7

编辑推荐:

  为解决医学教育选择题答案解析编写耗时问题,研究人员评估 GPT-4 生成解析的能力,发现其可行且受认可。

  在医学教育的 “战场” 上,医学生们为了通过美国医学执照考试(USMLE),常常埋头于大量的练习题中。因为大家都知道,完成和复习的练习题数量与考试成绩息息相关。然而,能为学生提供详尽反馈的答案解析,却如同 “稀缺资源” 一般。对于忙碌的医学教育工作者来说,编写这些解析既耗时又费力,许多练习题因此没有对应的答案解释,这无疑阻碍了学生从练习中获得更有效的学习。
在这样的困境下,人工智能(AI)技术的发展为解决这一问题带来了新的希望。大语言模型(LLMs)作为 AI 领域的 “新星”,能够处理和生成类似人类语言的文本。其中,GPT-4 作为当时 ChatGPT 的最新版本,它能否成为编写答案解析的 “得力助手” 呢?带着这样的疑问,来自美国阿尔伯特?爱因斯坦医学院(Albert Einstein College of Medicine)的研究人员展开了一项意义重大的研究。这项研究成果发表在《BMC Medical Education》上,为医学教育与人工智能的结合打开了新的篇章。

研究人员采用了单中心干预前后调查研究的方法。首先,他们邀请了美国一所医学院的 9 名器官系统预科课程主任(CD)参与研究,其中 8 名 CD 提供了同意并完成了调查。研究人员从每个课程的题库中随机选取 10 道文本形式的临床 vignette 式选择题(MCQ),这些题目都是学生在 2021 - 2022 学年使用过的。他们将这些题目输入到 GPT-4 中,并给出标准化的指令,让 GPT-4 选择最佳答案并为每个选项生成解析。如果 GPT-4 最初给出的答案错误,研究人员会给它提供正确答案并要求重新生成解析。之后,课程主任们会收到包含 GPT-4 生成解析的文档以及一份干预后调查问卷,用于评估解析的准确性、清晰度、适用性以及实施的可能性等。

研究结果令人眼前一亮。GPT-4 在首次尝试时,就正确回答了 80 道题中的 75 道(93.8%)。课程主任们对生成的解析给予了高度评价,他们认为大多数解析非常准确(77.5%)、非常清晰(83.8%)且非常适用(93.8%)。绝大多数解析(88.3%)只需进行很少的修改或无需修改就可直接使用。所有的课程主任都表示会在加入自己的编辑见解后使用 AI 生成的答案解析,而且大多数课程主任(75%)审查一组生成的解析平均只需要 4 分钟或更短时间。在满意度方面,所有课程主任都对生成的解释感到满意,其中 7 人(87.5%)表示 “非常满意”。

从这项研究中可以得出结论,GPT-4 是一种可接受且可行的工具,能够为医学教育中的选择题生成准确、清晰和适当的答案解析。这一研究成果具有重要意义,它不仅解决了医学教育工作者编写答案解析耗时的难题,还为学生提供了更丰富的学习资源,有助于提高学生的学习效果。而且,研究发现课程主任们在接触 AI 生成的材料后,对其态度从最初的怀疑转变为认可,这表明 AI 在医学教育中的应用有望得到更广泛的推广。

不过,研究也存在一定的局限性。例如,缺乏学生对生成解析的反馈,研究仅针对纯文本形式的选择题,且研究资源仅来自美国一所医学院,其结果可能无法推广到其他国家的医学教育中。但这也为后续研究指明了方向,未来可以进一步开展相关研究,完善 AI 在医学教育中的应用。

总体而言,这项研究为医学教育与人工智能的结合奠定了基础,展示了 GPT-4 在医学教育选择题答案解析生成方面的潜力,为未来医学教育的发展提供了新的思路和方向。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号