
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于拓扑融合模型(ToBaFu)的二维癌症图像分类研究:提升诊断性能与模型鲁棒性
【字体: 大 中 小 】 时间:2025年09月19日 来源:Neural Networks 6.3
编辑推荐:
本文提出一种创新的拓扑融合模型(ToBaFu),通过结合持久同调(PH)提取的全局拓扑特征与改进ResNet-50架构的局部形态特征,显著提升癌症图像分类性能。该模型在肺癌、结肠癌、结直肠癌及乳腺癌数据集上准确率与F1值均超99.6%,为医学影像诊断提供了兼具解释性与鲁棒性的新范式。
亮点
基于立方体复形计算持久同调(PH),从图像数据中提取统计特征与持久图像特征,并拼接为统一描述符。
提出的Topo模型将持久同调衍生的拓扑特征与浅层神经网络结合,用于癌症图像分类,增强全局形状表征与泛化性能。
开发了ToBaFu模型,这是一种新颖的融合框架,将Topo模型与端到端增强型ResNet架构结合用于癌症图像识别,提升诊断性能与模型鲁棒性。
方法
ToBaFu模型整合了两种癌症图像分类方法:基于拓扑特征的浅层神经网络(Topo模型)和ResNet-50的增强版本(Modified ResNet)。第3.1节阐述立方体复形的PH理论;第3.2节介绍从图像中提取拓扑特征的方法;第3.3节详细描述Topo模型与Modified ResNet模型,并基于这两种方法构建ToBaFu模型。
数据集
我们使用三个公开癌症图像数据集评估模型性能:LC-25000肺结肠组织病理图像数据集(Borkowski等, 2019)、CRC-5000结直肠癌组织学图像数据集(Kather等, 2016)和BUS-250乳腺超声图像数据集(Rodrigues, 2018)。表2展示了这些数据集的概览。
LC-250001:LC-25000数据集包含25,000张彩色图像,涵盖五类组织:正常结肠、正常肺、结肠腺癌、肺腺癌和肺鳞癌。每类含5,000张图像,分辨率统一为768×768像素。数据来自两个公共数据集:LC-25000和NCT-CRC-HE-100K。
CRC-50002:CRC-5000数据集包含5,000张结直肠癌组织学图像,覆盖九类组织:肿瘤上皮、间质、复杂间质、免疫细胞、坏死碎片、黏膜、脂肪、背景及正常上皮。图像分辨率为224×224像素,均从结直肠癌患者H&E染色切片中提取。
BUS-2503:BUS-250数据集包含250张乳腺超声图像,分为三类:正常、良性与恶性。图像尺寸不一,均经专业医师标注。该数据集源自巴西圣保罗大学医院。
结论
本文通过整合拓扑分析(Topo模型)与增强型ResNet架构(Modified ResNet),提出ToBaFu模型用于二维癌症图像分类。轻量级Topo模型在三个癌症分类数据集上表现出卓越的分类与泛化性能,凸显了拓扑特征提取在病理诊断中的关键作用。为深化特征学习,我们开发了Modified ResNet,通过用256滤波器1×1卷积层替换全局平均池化,更好地保留空间信息。最终,ToBaFu模型融合拓扑与深度特征,在癌症图像识别中实现性能与鲁棒性的双重提升。未来工作将探索拓扑特征在三维医学影像中的应用,并优化模型计算效率。
生物通微信公众号
知名企业招聘