
-
生物通官微
陪你抓住生命科技
跳动的脉搏
医学多模态多任务基础模型M3FM在肺癌筛查中的突破性应用:整合三维CT与临床数据提升20%癌症风险预测精度
【字体: 大 中 小 】 时间:2025年02月12日 来源:Nature Communications
编辑推荐:
针对肺癌筛查(LCS)中多模态数据利用率低、单任务模型性能受限的难题,研究团队开发了医学多模态多任务基础模型(M3FM),通过整合163,725例胸部CT与49类临床数据,实现17项LCS任务的协同优化。该模型将肺癌风险预测AUC提升20%,心血管疾病死亡率预测提升10%,并能自适应处理分布外任务,为临床决策提供智能化解决方案。
肺癌作为癌症相关死亡的首要原因,其筛查手段面临诸多挑战:尽管低剂量CT(LDCT)能将死亡率降低20%-24%,但全球筛查率不足10%,且存在假阳性率高、工作流程低效等问题。更关键的是,现有AI模型多基于单模态数据开发,无法充分挖掘临床中积累的文本、表格和影像等多模态信息。这些局限性促使美国伦斯勒理工学院等机构的研究团队开发了医学多模态多任务基础模型(M3FM),相关成果发表于《Nature Communications》。
研究团队通过系统收集来自NLST、MIDRC等中心的163,725例胸部CT系列和49类临床数据,构建了涵盖17项LCS任务的OpenM3Chest数据集。关键技术包括:(1)多尺度CT视觉Transformer(CTViT)处理三维体积图像;(2)分布式任务并行训练策略实现多任务协同优化;(3)基于注意力的多模态数据融合机制;(4)自监督预训练与迁移学习框架。
【多模态多任务数据集】
通过标准化流程整合了5类肺结节特征分析、心血管疾病(CVD)诊断与死亡率预测等任务,其中肺结节定位任务采用16层轴向切片输入,CVD分析则聚焦心脏区域三维体积。数据来源覆盖美国33家医疗机构的26,722名受试者,确保模型训练的广泛代表性。
【M3FM性能】
在肺癌1-6年风险预测中,M3FM的AUC达0.8232-0.9400,较Sybil模型提升5%-11%。对CVD死亡率预测的AUC为0.8904,超越Tri2D-Net模型9%。模型规模实验显示,参数量从2.57亿(M3FM-Base)增至8.65亿(M3FM-Huge)时,性能持续提升但边际效益递减。
【多模态协同效应】
相比单模态模型,整合临床文本使CVD诊断AUC提升3.14%至0.9238。关键发现包括:心脏病史、高血压等文本特征可使CVD预测AUC额外提升4%;CT体素物理尺寸编码将肺癌风险预测精度提高5%-12%。注意力热图可视化证实,模型能自动聚焦冠状动脉钙化区域与相关病史文本。
【泛化能力验证】
在独立测试集上,M3FM对MGH数据的CVD诊断AUC提升10.6%,肺癌风险预测提升20.8%。针对免疫检查点抑制剂肺炎的新任务,经90例数据微调后AUC达0.941,超越传统放射组学模型4.7%。
这项研究开创性地实现了三方面突破:首先,M3FM首次将三维CT体积与多样化临床数据统一编码,通过多尺度CTViT解决医学影像高维度难题;其次,分布式任务并行策略使17项临床任务协同优化,尤其提升标签稀疏任务的性能;最后,模型展现出卓越的临床适应性,既能识别关键数据元素,又可快速迁移至新型诊疗场景。
讨论部分强调,M3FM的临床价值在于其工作流程设计高度贴合实际需求——如同放射科医师综合多源信息进行决策,其问答式推理框架支持动态信息交互。尽管当前模型在心脏和肺部异常检测方面表现优异,作者指出通过扩展器官定位模块,可进一步覆盖机会性筛查场景。未来研究将聚焦前瞻性临床试验,验证模型在实时诊疗中的实际效益,并探索更高效的多模态数据标准化采集方案。这项成果不仅为肺癌筛查树立了新标杆,更为专科化医疗AI的发展提供了可复制的技术范式。
生物通微信公众号
知名企业招聘