GCN 模型:早期乳腺癌腋窝淋巴结转移预测的新希望

【字体: 时间:2025年04月23日 来源:Scientific Reports 3.8

编辑推荐:

  为精准判断早期乳腺癌患者腋窝淋巴结转移(ALNM)状态,江苏大学附属医院等机构研究人员对比三种图神经网络(GNN)模型。结果显示图卷积网络(GCN)表现最佳,其或可提供无创检测工具辅助临床决策。

  在乳腺癌的诊疗过程中,腋窝淋巴结转移(Axillary Lymph Node Metastasis,ALNM)状态是决定治疗方案的关键因素。据 2020 年全球癌症统计数据,女性乳腺癌是全球最常见的恶性肿瘤之一,且病死率较高。准确判断 ALNM 对于临床分期、优化治疗和评估预后至关重要。目前,确定 ALNM 的金标准是腋窝淋巴结清扫(Axillary Lymph Node Dissection,ALND)和前哨淋巴结活检(Sentinel Lymph Node Biopsy,SLNB),但这些方法具有侵入性,可能导致手术并发症,如上肢水肿和手臂麻木,严重影响患者生活质量。同时,当前的非侵入性成像方式,如腋窝超声(Ultrasound,US),评估 ALNM 的诊断性能有限,假阴性率较高。因此,开发一种无创、准确的 ALNM 预测方法迫在眉睫。
在这样的背景下,江苏大学附属医院、江苏大学、南京大学医学院附属鼓楼医院等机构的研究人员开展了一项极具意义的研究。他们基于腋窝超声和临床病理数据,对比了三种图神经网络(Graph Neural Network,GNN)模型预测早期乳腺癌 ALNM 的性能,研究成果发表在《Scientific Reports》上。

研究人员在开展此项研究时,采用了多种关键技术方法。首先,数据来源于先前郑等人发表的研究,该数据集包含 1342 名女性的临床、病理和腋窝超声数据,经筛选后 584 名患者的数据用于最终分析。然后,通过单变量逻辑回归分析确定候选因素,并对其进行标准化处理。利用这些数据构建图结构,将患者数据作为节点,通过计算余弦相似度确定节点间的边,进而生成图 G=(V,E) 和邻接矩阵。最后,构建了基于 GNN 的三种模型,即图卷积网络(Graph Convolutional Network,GCN)、图注意力网络(Graph Attention Network,GAT)和图同构网络(Graph Isomorphism Network,GIN),并使用多种评估指标对模型性能进行评估。

临床特征


研究人员对 584 例乳腺癌患者的临床特征进行分析,将其分为训练队列(466 例)和测试队列(118 例)。两个队列的 ALN 转移率分别为 42.3% 和 42.4%,训练队列患者平均年龄为 50.46±10.36 岁,测试队列患者平均年龄为 49.52±10.20 岁。同时,研究人员对患者的其他临床特征,如肿瘤大小、位置、病理类型、免疫组化指标以及腋窝超声特征等进行了详细分析。

三种图神经网络算法的诊断性能


研究人员从每位患者收集了 18 个参数,经单变量逻辑回归分析后,将参数减少到 10 个用于构建图并作为模型输入。在测试队列中,GCN、GAT 和 GIN 的 AUC 值分别为 0.77(95% 置信区间:0.69 - 0.84)、0.70(0.62 - 0.77)和 0.64(0.54 - 0.72)。GCN 算法在测试队列中的表现优于其他两种算法,其准确率(Accuracy,ACC)为 0.80,高于 GAT(ACC:0.73)和 GIN(ACC:0.64)。此外,研究人员还对模型的灵敏度(Sensitivity,SEN)、特异性(Specificity,SPEC)、阳性预测值(Positive Predictive Value,PPV)、阴性预测值(Negative Predictive Value,NPV)和 F1 评分等指标进行了评估,结果表明 GCN 模型在各项指标上也具有一定优势。通过混淆矩阵和精确召回曲线等方法对模型性能进行直观展示和评估,进一步验证了 GCN 模型的良好性能。

研究结果表明,三种 GNN 模型均能在一定程度上区分 ALNM 和非 ALNM,但 GCN 模型表现最佳。GCN 模型的优势可能在于其高效的特征聚合和消息传递中的平滑限制。与 GAT 相比,GCN 均匀聚合节点特征,避免了注意力机制带来的计算复杂性和权重分配不稳定性,在需要全局特征一致性的情况下更具优势。与 GIN 相比,GCN 在不同图架构上的泛化能力更强,GIN 虽然表达能力强,但对数据中的轻微结构变化过于敏感,而 GCN 在表达能力和稳健性之间取得了较好的平衡。

该研究首次利用腋窝超声和临床病理数据开发了用于预测早期乳腺癌患者 ALN 状态的 GNN 模型,为乳腺癌的临床诊断提供了新的思路和方法。然而,该研究也存在一定的局限性,如数据来源于单中心,需要多中心数据进一步验证;模型未纳入多灶性乳腺病变和双侧疾病患者,未来需开发针对此类患者的预测模型。尽管如此,该研究依然为乳腺癌的诊疗提供了重要的参考,有望推动乳腺癌诊断技术的发展,为临床决策提供更有力的支持,帮助医生更准确地判断患者病情,制定更合理的治疗方案,从而改善患者的预后。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号