编辑推荐:
在乳腺癌诊疗中,解读多序列 MRI 耗时且易主观出错。研究人员开展基于多参数 MRI 的乳腺癌管理大型模型(MOME)研究。结果显示,MOME 诊断性能与资深放射科医生相当,能减少活检、辅助分型和预测化疗反应,为乳腺癌无创个性化管理提供支持。
乳腺癌作为全球女性癌症死亡的主要原因,早期精准检测和个性化治疗对降低死亡率至关重要。目前,乳腺磁共振成像(MRI)虽在乳腺癌检测中敏感性最高,是高危女性筛查和分期的重要手段,也被推荐用于致密型乳腺女性的筛查,但解读多序列 MRI 信息存在难题。一方面,基于美国放射学院乳腺影像报告和数据系统(BI-RADS)解读 MRI 信息,需综合 T
1加权动态对比增强序列(DCE-MRI)、T
2加权成像(T
2WI)和扩散加权成像(DWI)等多参数数据,过程繁琐且易受主观因素影响;另一方面,人工智能(AI)在乳腺癌影像诊断领域虽有进展,但现有研究多基于单一的 DCE-MRI 序列,难以充分发挥多参数 MRI 的诊断价值,且多模态数据融合面临技术挑战。在此背景下,来自香港科技大学、深圳人民医院等多机构的研究人员开展了相关研究。
研究人员提出了基于基础模型(FMs)的大型混合模态专家模型(MOME),并利用中国三家医院收集的大规模多参数乳腺 MRI 数据集进行模型开发和评估。研究成果发表于《Nature Communications》,该研究为乳腺癌的无创、个性化管理提供了新的可能。
在研究方法上,研究人员收集了来自中国北方、东南和西南地区三家医院十年间 5205 名患者的 5220 次多参数乳腺 MRI 检查数据,分为数据集 1(DS1)、数据集 2(DS2)和数据集 3(DS3)。数据经预处理后,通过组织病理学检查确定患者的良恶性标签。MOME 模型采用统一可扩展结构,将不同 MRI 序列数据嵌入特征后输入基于 BEiT3 的 Transformer 架构,通过稀疏模态专家和软模态专家进行特征提取与融合。研究中对比了 Late Fusion、Feature Fusion 和 BEiT3 等方法,使用多种评估指标衡量模型性能,并进行了决策曲线分析。
研究结果主要包括以下几方面:
- 与放射科医生诊断性能相当:在内部测试集 2(n = 200)上评估 MOME 的恶性肿瘤诊断性能,与六名不同经验的放射科医生对比发现,MOME 与四名资深放射科医生(reader 2、3、5、6)在 F1 评分和马修斯相关系数(MCC)上无显著差异,且显著优于经验不足的初级放射科医生(reader 1)。MOME 的受试者工作特征曲线下面积(AUROC)为 0.913(95% CI:0.864,0.952),精确召回曲线下面积(AUPRC)为 0.948(95% CI:0.911,0.977)。
- 优于单模态或其他多模态方法:结合 DS1 内部测试集和 DS2 进行综合比较,MOME 的总体 AUROC 为 0.896(95% CI:0.876,0.913),AUPRC 为 0.901(95% CI:0.873,0.927),在 AUROC 上显著优于所有七个对比模型,在 AUPRC 上显著优于其中五个模型。
- 跨医院泛化能力良好:MOME 在不同医院的数据集上均表现出良好的泛化性能。在内部测试集 1(n = 307)、DS2 和 DS3 上,MOME 的 AUROC 分别为 0.912(95% CI 0.877,0.944)、0.899(95% CI 0.877,0.922)和 0.806(95% CI:0.790,0.822),表明其能准确区分不同医院患者的乳腺良恶性肿瘤。
- 模块和缺失序列分析:通过消融实验发现,MOME 的各个模块对模型性能均有贡献,去除任何一个组件都会导致性能下降。同时,MOME 在缺少序列的情况下仍能进行稳健推断,仅基于 DCE 序列时也能取得一定的诊断性能。
- 亚组分析:基于乳腺癌风险相关标准进行亚组分析,发现 MOME 在各亚组中总体表现良好。在老年患者、BPE 较少的患者中性能更高,在 BI-RADS 4 组中性能有所下降,且在 1.5T MRI 上的表现优于 3T MRI。
- 模型决策可解释:MOME 可通过集成梯度和 Shapley 值进行决策解释,能突出病变区域并分析各模态的贡献。DCE 和 DWI 在识别恶性患者中起重要作用,DCE 和 T2WI 在区分良性患者中贡献更大。
- 助力个性化管理:MOME 在临床应用中具有重要价值。决策曲线分析表明其在恶性肿瘤筛查中净效益高,能减少 BI-RADS 4 患者不必要的活检。此外,MOME 在三阴性乳腺癌(TNBC)亚型分类和新辅助化疗(NACT)病理完全缓解(pCR)预测方面也有潜力,AUROC 分别为 0.709 ± 0.067 和 0.694 ± 0.029。
研究结论表明,MOME 在多参数乳腺 MRI 分析中表现出高鉴别能力,能准确区分乳腺良恶性肿瘤,在活检推荐和治疗决策方面具有重要临床价值,为乳腺癌的无创、个性化管理提供了有效工具。不过,该研究也存在一定局限性,如未纳入其他临床数据,与放射科医生的比较方式有待优化,未来可进一步扩展至更精细的诊断。总体而言,该研究为乳腺癌诊疗开辟了新方向,有望推动乳腺癌精准医疗的发展。