
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:探索医学多模态人工智能的技术挑战与临床应用
【字体: 大 中 小 】 时间:2025年06月13日 来源:Medical Image Analysis 10.7
编辑推荐:
这篇综述系统回顾了2018-2024年间432篇文献,揭示了基于深度学习的多模态AI(MM-AI)在医疗领域的应用价值:整合影像(如CT/MRI)、病理、组学(omics)和临床文本等多源数据,平均提升AUC 6.2个百分点,但跨部门协调、数据异质性和缺失数据仍是关键挑战。文章深入剖析了融合架构(早期/中期/晚期融合)、临床转化路径及未来发展方向,为研究者提供全景式技术路线图。
医疗领域正经历数据驱动的变革,数字病理、生物传感器和下一代测序等技术催生了海量异构数据。传统多学科会诊模式面临可扩展性瓶颈,而多模态人工智能(MM-AI)通过整合互补数据源展现出临床决策优势。本文基于432项研究,首次全面评估MM-AI在医学全领域的应用现状。
数据异构性:不同模态(如二维影像与基因组数据)需特定编码器处理,卷积神经网络(CNN)仍是主流(82%研究采用),但视觉Transformer(ViT)使用率逐年上升。融合策略以中期融合为主(79%),其中特征拼接占69%,而外积或注意力机制(12%)能进一步提升性能。缺失数据处理成为关键瓶颈,69%研究直接剔除不完整样本,但新兴方法如可学习嵌入(learnable embeddings)和重构损失函数显示出潜力。
优势领域:神经系统(122篇)和呼吸系统(93篇)研究最活跃,ADNI和TCGA是最常用公共数据集。诊断任务占主导(45-91%),生存预测次之(18%)。典型案例如:
尽管性能优势明确,目前尚无FDA/CE认证的MM-AI产品。典型案例Esteva模型(前列腺癌病理+临床数据)通过NCCN指南落地,证明商业转化可行性。实施障碍包括:
三大趋势显现:
多模态AI正重塑医疗决策范式,其发展需学界、临床和监管协同推进。建立更多公共多模态数据集(如包含≥3模态)将成为加速临床落地的关键催化剂。
生物通微信公众号
知名企业招聘