利用大型语言模型确定结肠镜检查的间隔时间:一项跨机构的验证研究

《The American Journal of Gastroenterology》:Use of Large Language Models to Determine the Surveillance Colonoscopy Interval: A Bi-institutional Validation Study

【字体: 时间:2025年11月25日 来源:The American Journal of Gastroenterology 7.6

编辑推荐:

  智能结肠镜随访的AI应用研究显示,基于USMSTF指南的GPT-4o模型在1000例真实数据测试中平均准确率达94.6%,其中1-3枚息肉案例准确率95.8%,4枚以上案例准确率降至88.2%。研究验证了定制提示词可使LLM有效替代人工判断术后随访间隔,显著提升临床指南执行效率。

  

引言:

为了确定息肉切除术后结肠镜检查的适当监测间隔时间,内镜医师会综合结肠镜检查和病理报告的信息,然后应用指南推荐的间隔算法,例如美国多学会工作组(USMSTF)制定的算法。由于这些指南的复杂性,这种手动过程容易出错,因此需要自动化工具(包括大型语言模型,LLMs)来提高对指南的遵守程度。

目的:

本研究的主要目的是评估大型语言模型在根据1000份真实世界的结肠镜检查和病理报告来确定符合指南的息肉切除术后监测间隔时间方面的表现。

方法:

研究纳入了2023-2024年在两家学术医疗中心接受筛查或监测结肠镜检查的患者的资料。使用一个描述USMSTF息肉切除术后监测算法的定制提示,让LLM(GPT-4o)为数据集中的所有1000个案例确定适当的监测间隔时间。使用相同的模型、提示和数据集,该实验重复进行了10次;所有实验均在2025年1月27日至2月3日期间完成。

结果:

在10次实验中,平均准确率为94.6%。数据来源的医疗机构或病理报告印象中是否存在同步的上消化道内镜检查数据对准确率没有显著影响。含有1-3个结肠息肉的案例平均准确率为95.8%,而含有4个或更多结肠息肉的案例平均准确率为88.2%,合并p值<0.001。

结论:

使用定制提示的大型语言模型在确定基于指南的结肠镜监测间隔时间方面能够保持较高的准确率。

通俗语言总结:本研究测试了大型语言模型(LLM)根据美国多学会工作组的指南来确定正确的息肉切除术后结肠镜监测间隔时间的能力。研究人员使用了来自两家学术医疗中心的1000份结肠镜检查和病理报告的数据。在定制提示的指导下,LLM在10次试验中的平均准确率为94.6%。含有较少息肉的案例(95.8%)的准确率高于含有4个或更多息肉的案例(88.2%)。这些结果表明,LLM可以有效地自动化监测间隔时间的确定过程,从而可能减少临床实践中的错误。

文本由机器生成,可能存在不准确之处。常见问题解答

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号