
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能辅助叙事在外科住院医师个人陈述中的应用与影响分析
【字体: 大 中 小 】 时间:2025年06月20日 来源:Journal of Surgical Education 2.6
编辑推荐:
本研究聚焦ChatGPT等生成式人工智能(AI)对外科住院医师申请文书的影响。UMass Chan Medical School团队通过GPTZero和Copyleaks双工具检测2022-24年NRMP Match周期1490份个人陈述(PS),发现AI使用率从2022-23年的10.2%激增至2023-24年的36.6%,非英语母语申请者AI使用率达38.7%。研究首次量化AI在医学教育选拔环节的渗透,为制定AI应用伦理规范提供数据支撑。
在ChatGPT掀起的技术浪潮中,医学教育领域正面临前所未有的挑战。2022年11月发布的这款生成式人工智能(AI)工具,仅用两个月就突破1亿用户大关,其强大的文本生成能力不仅改变了学术写作范式,更悄然渗透到医学人才选拔的核心环节——住院医师申请的个人陈述(PS)撰写中。传统PS被视为展现申请人特质、职业动机的重要载体,但AI的介入使得文书真实性评估变得复杂。尤其在外科这类竞争激烈的专科,PS质量直接影响匹配结果,而目前尚缺乏关于AI在住院医师申请中实际使用情况的客观数据。
美国马萨诸塞大学陈医学院Baystate普外科住院医师项目的研究团队开展了一项开创性研究。他们收集2022-23和2023-24两个NRMP Match周期的2553份申请,最终纳入1490份美国本土MD/DO申请者的PS,采用GPTZero和Copyleaks双检测系统进行AI成分分析。研究设计巧妙地将2022-23周期设为基线组(因ChatGPT尚未发布),2023-24周期为暴露组,通过对比揭示AI技术的实际影响。
关键技术方法包括:1) 回顾性队列研究设计,样本来自NRMP Match周期申请者;2) 采用GPTZero和Copyleaks双AI检测平台交叉验证;3) 统计学分析使用T检验和Fisher精确检验;4) 亚组分析聚焦非英语母语者等敏感人群。
结果部分呈现多重发现:
Objective 证实研究首次量化AI在手术专科申请中的使用趋势。
Design 显示双检测工具策略提高结果可靠性,GPTZero灵敏度显著高于Copyleaks。
Setting 指明数据来自美国东北部重要教学医院,具有地域代表性。
Participants 显示最终样本量1490份(2022-23年758份,2023-24年732份),基线特征均衡。
Results 核心数据显示:AI检测率从2022-23年的10.2%(GPTZero)/2.6%(Copyleaks)飙升至2023-24年的36.6%/22.5%,双工具一致判定率从1.7%升至21.2%(p<0.001)。AI使用组呈现三大特征:非英语母语者比例更高(38.7% vs 19.6%)、总字数更少(597.3 vs 645.9)、句子更短(10.0 vs 10.4词)。
讨论部分指出:尽管AI检测工具存在约5%假阳性率,但趋势性变化具有显著意义。特别关注到非英语母语申请者更依赖AI辅助的现象,可能反映语言障碍下的公平性困境。研究预测AI使用率将持续攀升,建议培训项目建立明确的AI使用披露政策。
这项发表在《Journal of Surgical Education》的研究具有三重里程碑意义:首先,建立首个外科住院医师申请中AI使用的基准数据;其次,揭示技术变革下医学人才评估体系面临的伦理挑战;最后,为AI时代医学教育公平性研究开辟新路径。正如研究者强调,问题的关键不在于是否禁止AI,而是如何建立透明、负责任的AI使用框架,在技术创新与学术诚信间取得平衡。
生物通微信公众号
知名企业招聘