SpecNet:一种基于高光谱成像和可解释深度学习用于乳腺纤维腺瘤与叶状肿瘤鉴别诊断的新型光谱学习方法
《Photodiagnosis and Photodynamic Therapy》:SpecNet: A Hyperspectral Band-Learning Method for Slice-Level Differentiation of Fibroadenoma and Phyllodes Tumor
【字体:
大
中
小
】
时间:2025年10月22日
来源:Photodiagnosis and Photodynamic Therapy 2.6
编辑推荐:
本研究针对乳腺纤维腺瘤(FA)与叶状肿瘤(PT)组织学鉴别诊断的临床挑战,开发了结合可见-近红外高光谱成像(HSI)与轻量级可解释深度学习模型(SpecNet)的新方法。研究回顾性收集215例FFPE样本,通过五折交叉验证证实SpecNet在区分FA与PT方面AUC达0.89,准确率85.21%,并识别出540-590nm(血红蛋白吸收)和700-820nm(近红外水散射)为关键诊断波段,为病理诊断提供了客观的光谱证据,展现出临床转化潜力。
在乳腺病理诊断领域,纤维腺瘤(Fibroadenoma, FA)与叶状肿瘤(Phyllodes Tumor, PT)的鉴别诊断一直是个棘手的临床难题。这两种肿瘤都属于纤维上皮性病变,但它们的临床管理策略、复发风险以及手术切缘规划却截然不同。特别是叶状肿瘤,即使完全切除后复发率仍可达20-35%。更复杂的是,低级别叶状肿瘤(良性/交界性)与纤维腺瘤在组织学上存在显著重叠,加之活检组织有限,使得准确区分变得异常困难。虽然免疫组化有时能提供帮助,但标志物特异性低以及观察者间差异限制了其应用价值。这种诊断的不一致性在美国病理学家学会报告中也有明确指出。面对这些挑战,开发客观、定量的辅助诊断方法成为当务之急。
正是在这样的背景下,山东中医药大学第一临床医学院的研究团队在《Photodiagnosis and Photodynamic Therapy》期刊上发表了一项创新性研究,他们开发了一种名为SpecNet的高光谱波段学习方法,用于实现切片水平的纤维腺瘤与叶状肿瘤的鉴别诊断。这项研究巧妙地将高光谱成像技术与可解释深度学习相结合,为这一经典病理诊断难题带来了新的解决方案。
高光谱成像(Hyperspectral Imaging, HSI)技术能够同时提供空间和光谱信息,实现超越传统明场显微镜的生化成分无创检测。在可见-近红外波段(400-1000nm),不同组织会呈现出独特的光谱"指纹",这些差异反映了组织内部的血红蛋白、胶原蛋白等生物分子的吸收和散射特性。从生物学角度看,FA与PT的关键区别在于间质特性——除了细胞密度和有丝分裂活性差异外,PT更常出现TERT启动子改变、TP53异常和EGFR扩增,而良性病变通常与早期MED12突变相关。这些分子差异往往伴随着细胞外基质重塑和胶原重组,而HSI正好对胶原、血红蛋白和脂质的光谱特征敏感,从而在形态学观察与潜在分子改变之间建立了桥梁。
研究团队开展了一项回顾性单中心研究,在2023年1月至2025年7月期间收集了215例患者(105例FA,110例PT)的福尔马林固定石蜡包埋(Formalin-Fixed Paraffin-Embedded, FFPE)切片。每个一维反射光谱都经过标准化预处理,包括反射率校准、Savitzky-Golay平滑、一阶导数计算和矢量归一化。研究人员开发了紧凑的深度学习框架SpecNet,整合了卷积和注意力模块,既能捕获局部光谱变化,又能建模长程依赖关系。通过五折交叉验证评估模型性能,并与三种基线分类器(1D-CNN、Transformer-SVM和XGBoost)进行比较。
研究采用回顾性设计,收集215例经病理确诊的FA和PT患者的FFPE样本,通过高光谱成像系统获取400-1000nm范围的光谱数据。关键技术包括光谱预处理(反射率校准、噪声抑制、导数变换)、SpecNet模型开发(结合卷积神经网络与Transformer架构)以及五折交叉验证评估。模型设计注重轻量化和可解释性,通过局部波段分组和注意力机制识别关键诊断波段。
在400-1000nm光谱范围内,FA和PT表现出总体相似但存在系统性差异的光谱特征。FA在380-410nm处显示更高的短波长峰值,但在430-600nm范围内的反射率低于PT。在红色至近红外散射平台(700-800nm),FA达到略高的峰值。经过S-G平滑处理后,540-580nm处与脱氧血红蛋白相关的双波谷区域,PT显示较浅的凹陷,而FA呈现更明显的波谷。标准化处理后,PT在450-600nm显示更平坦的"平台",而FA在700-780nm处显示更尖锐的归一化峰值。一阶导数光谱强调,FA在620-680nm处表现出更强的正斜率,在740-850nm处有更深的负斜率,这些差异与血红蛋白吸收、散射平台和水吸收肩部相一致。
SpecNet实现了0.89的AUC值,准确率85.21%,敏感性80.73%,特异性87.45%,一致优于基线模型。消融实验表明,局部波段分组(Local Band Grouping, LBG)模块最为关键,其移除使准确率降至82.18%。ROC分析显示SpecNet曲线最接近左上角,通过DeLong检验证实其优于最强基线模型1D-Transformer-SVM(AUC=0.83)的差异具有统计学意义(p=0.018)。错误分析发现,假阴性主要发生在基质细胞稀少且胶原致密的PT标本中,而假阳性常与FA中的黏液样变性或局灶性坏死相关。
光谱分析确定540-590nm和700-820nm为关键诊断区域,分别对应血红蛋白吸收和近红外水散射。差异光谱(FA-PT)在450-620nm为负值,在560-590nm处出现最明显的波谷(-0.45至-0.50),表明PT在血红蛋白吸收区域有更强的反射率。比率光谱(FA/PT)在450-620nm保持<1,在760-830nm处稳定在1.03-1.08以上。特征如R740/R560比率、620-680nm斜率以及820-950nm平均反射率为稳健且可解释的标志物。
SpecNet成功实现了纤维腺瘤与叶状肿瘤的稳健区分,在单一机构的离体HSI数据上表现出强大的诊断性能。该方法有效平衡了可解释性与泛化能力,明显优于代表性基线模型。可解释性分析揭示模型主要依赖血红蛋白相关区域(540-590nm)和红色/近红外散射平台(700-820nm):前者在PT中表现出相对较强的反射率,而在FA中后者更强。这些光谱标志物与血氧水平和基质组成的生理学差异相对应,与组织病理学见解高度一致。
研究的优势在于提出了一种紧凑且可重现的框架,通过可解释的深度学习模型为病理诊断提供了客观的光谱证据。局部波段分组模块能够自适应地将连续光谱区域聚合为紧凑的片段标记,每个标记代表相邻波段的学习摘要,这种分组反映了光谱信号的自然连续性,产生与生化成分相对应的可解释光谱单元。
然而,该研究也存在一定局限性。数据集完全来自单中心的离体病理切片,缺乏外部或体内验证,这限制了研究结果的普适性。此外,回顾性和探索性设计也意味着需要进一步的前瞻性验证。
展望未来,研究团队计划沿着几个有限但高影响力的方向推进工作:多中心和大规模前瞻性验证以确认可重复性;系统评估批间和设备间变异性并建立标准化校准;与超声和组织病理学进行多模态整合以增强临床稳健性。
这项研究凸显了高光谱成像结合可解释人工智能在辅助乳腺肿瘤诊断中的临床潜力,为精准病理学的发展开辟了新途径。通过将组织学见解、光学光谱学和分子证据相结合,该研究建立了一个将基质生物化学与光谱指纹联系起来的综合框架,为病理学家在术中会诊和活检解读提供了潜在的有力工具。随着技术的进一步成熟和验证,这种方法有望在活检分诊和术中切缘评估等临床场景中发挥重要作用,最终造福于患者。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号