人工智能时代外科证据等级:重塑信任与决策基石

【字体: 时间:2025年04月16日 来源:Langenbeck's Archives of Surgery 2.1

编辑推荐:

  在人工智能(AI)飞速发展的当下,传统证据等级体系受冲击。研究人员针对 AI 在外科证据生成中的地位问题展开研究。结果表明,透明且可重复应用于科学框架的 AI 能助力产生高质量证据。这为外科临床决策提供了新方向,意义重大。

  在当今医疗领域,随着人工智能(Artificial Intelligence,AI)技术的蓬勃发展,尤其是大型语言模型和机器学习系统的广泛应用,传统的医学证据等级体系正面临着前所未有的挑战。长久以来,外科医生在临床决策时,主要依据一套成熟的证据等级体系。位于金字塔顶端的是随机对照试验(Randomised Controlled Trials,RCTs)和带有荟萃分析的系统评价,而最底层则是专家意见。例如牛津循证医学中心(Oxford Centre for Evidence-Based Medicine,OCEBM)提供的证据金字塔,一直是评估证据强度的可靠框架。
然而,AI 的崛起改变了这一局面。AI 具备合成结果、撰写总结和建议的能力,这些工作以往都是由人类研究人员完成的。虽然证据生成的自动化并非新生事物,Cochrane 手册也允许在系统评价中使用自动化工具,但 AI 的广泛应用仍引发了一个关键问题:在证据的产生和使用过程中,我们究竟该信任谁?毕竟,对证据的信任不仅取决于产出的内容,还与产出方式密切相关。在这样的背景下,来自瑞士和德国的研究人员开展了相关研究,其成果发表在《Langenbeck's Archives of Surgery》上。

研究人员主要采用了理论分析和对比论证的方法。他们分析了不同类型 AI 产出在现有证据等级体系中的定位,并探讨了如何将 AI 更好地融入医学研究和临床实践。在分析过程中,参考了大量已有的医学研究和 AI 应用案例。

研究结果如下:

  • AI 产出的证据等级定位:部分人建议对传统二维证据金字塔进行改进,构建更细致的结构,如增加代表证据生成所需努力、证据量和临床影响等维度。对于那些无法明确数据源和方法学的聊天机器人给出的临床答案,其可靠性较低,应处于证据金字塔底层,与专家意见(Level 5)相当,甚至可列为新的 “Level 6”。因为缺乏透明性和可追溯性的 AI 产出,无论看起来多快速、自信或令人信服,都不能被视为有效证据。而且,输入不当还会导致 “幻觉” 问题。
  • AI 助力高质量研究:当 AI 在健全的科学框架内透明且可重复地使用,并有适当的文档记录、批判性评估和人工监督时,它就能成为高质量研究的强大助推器。此时,AI 可更高效地产生 1a 级证据,比如对 RCTs 进行带有荟萃分析的系统评价。这类由 AI 增强的证据,因其遵循科学方法,理应处于证据金字塔顶端。

研究结论和讨论部分指出,在外科领域,临床决策往往会带来即时且可能不可逆的后果,所以我们需要既及时又值得信赖的证据。AI 无法取代临床试验和外科医生的判断,但如果合理使用,它能帮助医生更快、更精准地得出可靠结论。这一研究的重要意义在于,明确了 AI 在外科证据生成中的作用和地位,为临床医生和研究人员在 AI 时代如何正确利用 AI 提供了指导,有助于推动外科医学在 AI 技术支持下更科学地发展。它强调了在 AI 时代,关键不是在临床试验和算法之间做选择,而是依靠能评估并整合两者的人类专家,从而更好地服务于临床实践和医学研究。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号