人工智能时代外科证据等级：重塑信任与决策基石

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年04月16日 来源：Langenbeck's Archives of Surgery 2.1

编辑推荐：

　　在人工智能（AI）飞速发展的当下，传统证据等级体系受冲击。研究人员针对 AI 在外科证据生成中的地位问题展开研究。结果表明，透明且可重复应用于科学框架的 AI 能助力产生高质量证据。这为外科临床决策提供了新方向，意义重大。

　　在当今医疗领域，随着人工智能（Artificial Intelligence，AI）技术的蓬勃发展，尤其是大型语言模型和机器学习系统的广泛应用，传统的医学证据等级体系正面临着前所未有的挑战。长久以来，外科医生在临床决策时，主要依据一套成熟的证据等级体系。位于金字塔顶端的是随机对照试验（Randomised Controlled Trials，RCTs）和带有荟萃分析的系统评价，而最底层则是专家意见。例如牛津循证医学中心（Oxford Centre for Evidence-Based Medicine，OCEBM）提供的证据金字塔，一直是评估证据强度的可靠框架。

然而，AI 的崛起改变了这一局面。AI 具备合成结果、撰写总结和建议的能力，这些工作以往都是由人类研究人员完成的。虽然证据生成的自动化并非新生事物，Cochrane 手册也允许在系统评价中使用自动化工具，但 AI 的广泛应用仍引发了一个关键问题：在证据的产生和使用过程中，我们究竟该信任谁？毕竟，对证据的信任不仅取决于产出的内容，还与产出方式密切相关。在这样的背景下，来自瑞士和德国的研究人员开展了相关研究，其成果发表在《Langenbeck's Archives of Surgery》上。

研究人员主要采用了理论分析和对比论证的方法。他们分析了不同类型 AI 产出在现有证据等级体系中的定位，并探讨了如何将 AI 更好地融入医学研究和临床实践。在分析过程中，参考了大量已有的医学研究和 AI 应用案例。

研究结果如下：

AI 产出的证据等级定位：部分人建议对传统二维证据金字塔进行改进，构建更细致的结构，如增加代表证据生成所需努力、证据量和临床影响等维度。对于那些无法明确数据源和方法学的聊天机器人给出的临床答案，其可靠性较低，应处于证据金字塔底层，与专家意见（Level 5）相当，甚至可列为新的 “Level 6”。因为缺乏透明性和可追溯性的 AI 产出，无论看起来多快速、自信或令人信服，都不能被视为有效证据。而且，输入不当还会导致 “幻觉” 问题。
AI 助力高质量研究：当 AI 在健全的科学框架内透明且可重复地使用，并有适当的文档记录、批判性评估和人工监督时，它就能成为高质量研究的强大助推器。此时，AI 可更高效地产生 1a 级证据，比如对 RCTs 进行带有荟萃分析的系统评价。这类由 AI 增强的证据，因其遵循科学方法，理应处于证据金字塔顶端。

研究结论和讨论部分指出，在外科领域，临床决策往往会带来即时且可能不可逆的后果，所以我们需要既及时又值得信赖的证据。AI 无法取代临床试验和外科医生的判断，但如果合理使用，它能帮助医生更快、更精准地得出可靠结论。这一研究的重要意义在于，明确了 AI 在外科证据生成中的作用和地位，为临床医生和研究人员在 AI 时代如何正确利用 AI 提供了指导，有助于推动外科医学在 AI 技术支持下更科学地发展。它强调了在 AI 时代，关键不是在临床试验和算法之间做选择，而是依靠能评估并整合两者的人类专家，从而更好地服务于临床实践和医学研究。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号