深度学习照亮耳鼻喉头颈外科人工智能鸿沟:现状剖析与突破路径

【字体: 时间:2025年05月11日 来源:npj Digital Medicine 12.4

编辑推荐:

  在耳鼻喉头颈外科(OHNS)中,人工智能(AI)临床验证研究匮乏。研究人员开展了 OHNS 深度学习研究的范围综述,发现近 444 项研究多为概念验证阶段,缺乏临床验证。该研究为推动 OHNS 领域 AI 临床应用提供了方向。

  在医疗领域,人工智能(AI)技术本有望大放异彩,为医生提供更精准高效的诊疗支持,尤其是在耳鼻喉头颈外科(OHNS)。OHNS 临床实践中积累了大量如影像、音频、视频等半结构化数据,为 AI 分析创造了绝佳条件,相关概念验证研究也不断涌现。然而,现实却不尽如人意。如今,耳鼻喉科医生在临床工作中使用的 AI 工具寥寥无几,且大多并非专为 OHNS 定制。截至 2024 年 8 月 7 日,在 950 个 FDA 批准的 AI / 机器学习医疗设备中,仅有两款是针对 OHNS 开发的。这一巨大落差被称为医疗领域的 “AI 鸿沟”,而 OHNS 领域的 “AI 鸿沟” 似乎格外深。临床验证研究对于 AI 工具转化至临床应用至关重要,却可能是 OHNS 领域 AI 研究的短板。为探究这一现象,来自斯坦福大学和约翰霍普金斯大学的研究人员开展了一项关于 OHNS 中深度学习研究的范围综述,相关成果发表在《npj Digital Medicine》上。
研究人员主要采用了文献检索与筛选、数据提取与分析的技术方法。他们依据 PRISMA 扩展的范围综述指南,与研究馆员合作制定检索策略,在 MEDLINE、EMBASE 和 Web of Science 数据库中进行检索。筛选出符合标准的研究后,提取相关数据,并按照 AI 在医疗领域的发展阶段等标准进行分类分析。

研究结果如下:

  • 研究的时空分布:在 2012 - 2022 年这 10 年间,OHNS 领域深度学习相关出版物数量呈指数级增长,从 2012 年的 0 篇增至 2022 年的 105 篇。作者所属机构遍布 48 个国家,美国、中国和韩国的发文量位居前列。
  • 研究的多维度特征:从亚专业来看,耳科学和神经耳科学(包括听力学)相关研究最多,占 28%。从应用目的而言,56% 的 AI 应用旨在扩展医疗服务提供者的能力,30% 用于疾病筛查。在数据类型方面,非放射学(36%)和放射学(19%)图像是 AI 模型分析的主要数据。卷积神经网络(CNN)模型是最常用的深度学习模型类型。
  • 研究的成熟度与规范度:在研究阶段上,几乎所有研究(99.3%)都处于计算机模拟概念验证阶段,仅有 3 项(0.7%)进入离线验证阶段,尚无临床验证研究。在报告指南使用上,仅有 24 项研究(5.4%)遵循相关指南,且使用的指南种类繁多,以诊断准确性研究报告标准(STARD)为主(2.9%)。在验证方法上,单机构和回顾性验证方法应用最多,前瞻性评估较少,部分研究的验证方法存在缺陷,限制了模型泛化性评估。此外,仅有 9.2% 的研究尝试解释 AI 模型,最常用的方法是梯度加权类激活映射(Grad - CAM)(3%)和类激活映射(CAM)(2%)。

研究结论和讨论部分指出,OHNS 领域的 AI 鸿沟显著,缺乏临床验证研究严重阻碍了 AI 在该领域的临床应用发展。为跨越这一鸿沟,研究人员提出多项建议:一是聚焦低复杂度、低风险任务,如自动化常规任务和分流工作流程,而非仅关注诊断应用;二是严格遵循 AI 预测工具的报告指南,提高研究的标准化和可靠性;三是优先开展 AI 应用的临床验证,采用基于机构的局部验证替代外部验证,并利用联邦学习和群体学习等框架解决数据共享问题;四是重视 OHNS 数据集的 “ground truth” 标签准确性,避免模糊精细诊断类别影响模型预测。尽管该研究存在一定局限性,如检索词设计导致部分研究遗漏、数据提取存在主观性等,但它首次全面审视了 OHNS 领域的深度学习应用,为后续研究指明了方向。若能成功推动 AI 技术在 OHNS 领域的临床转化,有望为更广泛的医疗领域提供借鉴,助力跨越 AI 鸿沟,实现 AI 技术在医疗行业的真正价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号