
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多任务与多实例学习的深度学习框架预测乳腺癌腋窝淋巴结转移
【字体: 大 中 小 】 时间:2025年06月20日 来源:npj Precision Oncology 6.8
编辑推荐:
本研究针对乳腺癌腋窝淋巴结(ALN)转移预测的临床挑战,提出了一种创新的多任务学习(MTL)与多实例学习(MIL)框架。通过整合超声图像中原发性肿瘤和ALN区域的深度学习特征,该模型在内部和外部测试队列中分别达到AUC 0.832和0.918,显著优于传统临床模型。研究首次模拟真实诊断场景,结合Transformer架构(Segformer)实现病灶分割与分类的协同优化,为无创ALN评估提供了高精度工具,有望成为临床决策的“第二阅片者”。
乳腺癌是全球女性最高发的恶性肿瘤,其治疗策略高度依赖腋窝淋巴结(ALN)转移状态的准确评估。当前临床实践中,ALN活检或手术清扫虽是金标准,但具有创伤性且部分患者可能面临过度治疗。超声检查虽能无创显示肿瘤和ALN特征,但诊断准确性受限于医生经验,对微转移的识别存在困难。既往基于卷积神经网络(CNN)的模型多为单一分类任务,既未考虑多视角联合诊断的临床场景,也缺乏对ALN阴性患者(超声未检出淋巴结)的适应性设计。
为解决这些问题,中南大学湘雅二医院与河南省肿瘤医院的研究团队开发了一种两阶段深度学习框架,相关成果发表于《npj Precision Oncology》。该研究创新性地将多任务学习(MTL)与多实例学习(MIL)相结合:第一阶段通过MTL同步完成病灶分割、区域分类(原发灶/ALN)和单图像预测;第二阶段采用MIL整合患者多视角图像特征,模拟真实临床决策流程。研究团队对比了HRNet、Swin-Transformer等6种网络架构,最终基于Segformer的模型表现最优,在内部测试队列中AUC达0.832(敏感性0.815,特异性0.854),外部验证队列AUC进一步提升至0.918。
关键技术方法包括:1)收集1144例患者的超声图像(含原发灶和ALN区域手工标注);2)构建MTL-MIL混合框架,采用SAM(Segment Anything Model)解码器实现病灶分割;3)通过类激活映射(CAM)可视化模型关注区域;4)使用DeLong检验比较不同模型AUC差异;5)通过决策曲线分析(DCA)评估临床效用阈值。
临床特征分析
队列数据显示64.2%-67.1%患者存在ALN转移,转移组更易出现淋巴管浸润(p<0.001)和更高超声BI-RADS分级。这种人群异质性凸显了模型泛化能力的挑战。
算法性能比较
Transformer模型显著优于传统临床模型(p<0.001),其中Segformer在外部测试中特异性达0.957,假阳性率仅0.043。值得注意的是,当阈值概率>0.43时,该模型的临床净收益超越传统策略。
激活热图解析
CAM可视化证实模型能聚焦于肿瘤内部和ALN特征区域。如图4所示,真实阳性案例中模型准确识别ALN的红色激活区,而假阴性案例则显示模型未能捕获关键特征。
讨论与意义
该研究首次实现了符合临床工作流的ALN预测系统:对于超声可见ALN者整合原发灶与淋巴结特征,对未检出ALN者仅用原发灶信息。通过强制模型关注分割区域(如图S1所示),有效避免了传统分类模型的“捷径学习”问题。相比前哨淋巴结活检7.8-27.3%的假阴性率,本模型0.149-0.185的数值更具竞争力,但其临床应用仍需前瞻性验证。
这项工作的突破性体现在三方面:1)方法学上开创了MTL-MIL协同框架,为医学影像分析提供新范式;2)临床价值上以0.957的高特异性显著降低过度手术风险;3)技术层面证实Transformer在医学二元分类任务中的潜力,为后续研究指明方向。未来可通过融合多模态数据和优化采样策略进一步提升模型鲁棒性。
生物通微信公众号
知名企业招聘