人工智能辅助叙事在外科住院医师个人陈述中的应用与影响分析

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月20日 来源：Journal of Surgical Education 2.6

编辑推荐：

　　本研究聚焦ChatGPT等生成式人工智能(AI)对外科住院医师申请文书的影响。UMass Chan Medical School团队通过GPTZero和Copyleaks双工具检测2022-24年NRMP Match周期1490份个人陈述(PS)，发现AI使用率从2022-23年的10.2%激增至2023-24年的36.6%，非英语母语申请者AI使用率达38.7%。研究首次量化AI在医学教育选拔环节的渗透，为制定AI应用伦理规范提供数据支撑。

在ChatGPT掀起的技术浪潮中，医学教育领域正面临前所未有的挑战。2022年11月发布的这款生成式人工智能(AI)工具，仅用两个月就突破1亿用户大关，其强大的文本生成能力不仅改变了学术写作范式，更悄然渗透到医学人才选拔的核心环节——住院医师申请的个人陈述(PS)撰写中。传统PS被视为展现申请人特质、职业动机的重要载体，但AI的介入使得文书真实性评估变得复杂。尤其在外科这类竞争激烈的专科，PS质量直接影响匹配结果，而目前尚缺乏关于AI在住院医师申请中实际使用情况的客观数据。

美国马萨诸塞大学陈医学院Baystate普外科住院医师项目的研究团队开展了一项开创性研究。他们收集2022-23和2023-24两个NRMP Match周期的2553份申请，最终纳入1490份美国本土MD/DO申请者的PS，采用GPTZero和Copyleaks双检测系统进行AI成分分析。研究设计巧妙地将2022-23周期设为基线组（因ChatGPT尚未发布），2023-24周期为暴露组，通过对比揭示AI技术的实际影响。

关键技术方法包括：1) 回顾性队列研究设计，样本来自NRMP Match周期申请者；2) 采用GPTZero和Copyleaks双AI检测平台交叉验证；3) 统计学分析使用T检验和Fisher精确检验；4) 亚组分析聚焦非英语母语者等敏感人群。

结果部分呈现多重发现：
Objective 证实研究首次量化AI在手术专科申请中的使用趋势。
Design 显示双检测工具策略提高结果可靠性，GPTZero灵敏度显著高于Copyleaks。
Setting 指明数据来自美国东北部重要教学医院，具有地域代表性。
Participants 显示最终样本量1490份（2022-23年758份，2023-24年732份），基线特征均衡。
Results 核心数据显示：AI检测率从2022-23年的10.2%(GPTZero)/2.6%(Copyleaks)飙升至2023-24年的36.6%/22.5%，双工具一致判定率从1.7%升至21.2%(p<0.001)。AI使用组呈现三大特征：非英语母语者比例更高(38.7% vs 19.6%)、总字数更少(597.3 vs 645.9)、句子更短(10.0 vs 10.4词)。

讨论部分指出：尽管AI检测工具存在约5%假阳性率，但趋势性变化具有显著意义。特别关注到非英语母语申请者更依赖AI辅助的现象，可能反映语言障碍下的公平性困境。研究预测AI使用率将持续攀升，建议培训项目建立明确的AI使用披露政策。

这项发表在《Journal of Surgical Education》的研究具有三重里程碑意义：首先，建立首个外科住院医师申请中AI使用的基准数据；其次，揭示技术变革下医学人才评估体系面临的伦理挑战；最后，为AI时代医学教育公平性研究开辟新路径。正如研究者强调，问题的关键不在于是否禁止AI，而是如何建立透明、负责任的AI使用框架，在技术创新与学术诚信间取得平衡。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号