
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于CNN的宫颈癌细胞Pap涂片图像分类方法:一种无需分割的高精度诊断新策略
【字体: 大 中 小 】 时间:2025年07月06日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对宫颈癌早期诊断中传统人工筛查效率低、误诊率高的问题,开发了一种基于卷积神经网络(CNN)的Pap涂片图像分类系统。研究人员通过对比ResNet-50、Xception等7种预训练模型在SIPaKMeD和Herlev数据集上的表现,创新性地提出直接对全切片图像(WSI)进行无分割分类的方法。最终Xception模型在SIPaKMeD数据集上取得97.55%的分类准确率,验证了无需细胞分割即可实现高精度诊断的可行性,为自动化宫颈癌筛查提供了新思路。
宫颈癌是全球女性健康的重要威胁,特别是在发展中国家,由于筛查资源有限,早期诊断面临巨大挑战。传统Pap涂片检查依赖病理学家肉眼观察,不仅效率低下,且存在高达20%的误诊率。尽管人类乳头瘤病毒(HPV)疫苗的推广使发病率有所下降,但99%的宫颈癌病例仍与HPV持续感染相关。这种"筛查困境"催生了计算机辅助诊断系统的研发需求,而深度学习技术的突破为自动化宫颈癌筛查带来了新的可能。
针对这一临床需求,来自Vellore理工学院的研究团队Remita Austin和R. Parvathi在《Scientific Reports》发表了一项创新研究。他们开发了基于卷积神经网络(CNN)的宫颈癌细胞分类系统,重点解决了传统方法中必须进行细胞分割的技术瓶颈。研究采用SIPaKMeD和Herlev两个公开数据集,包含4049张单细胞图像和966张全切片图像,涵盖5类正常/异常细胞形态。技术路线上,团队首先对比了7种预训练CNN模型(包括ResNet-50、VGG-16/19、DenseNet-121/201、InceptionV3和Xception)的性能,创新性地引入数据增强、L2正则化(λ=0.001)和批归一化等技术提升模型鲁棒性。特别值得注意的是,研究突破了常规两阶段(先分割后分类)流程,首次验证了直接对全切片图像进行无分割分类的可行性。
研究方法部分展示了严谨的技术路线。数据预处理阶段采用旋转(40°)、平移(0.2)、缩放(0.2)等参数进行图像增强,将训练样本量扩大8-30倍。特征提取使用预训练CNN模型,通过转移学习技术微调网络权重。模型优化环节引入批归一化层处理激活值分布,其数学表达为yi=γx?i+β,其中x?i=(xi-μB)/√(σB2+ε)。对比实验设计包含三个层次:原始数据、增强数据、以及增强+正则化数据,系统评估了不同技术组合对分类性能的影响。
研究结果部分呈现了丰富的实验数据。在单细胞图像分类任务中,Xception模型表现最优:SIPaKMeD数据集(5分类)上准确率达97.55%,召回率97.55%;Herlev数据集(7分类)准确率90.42%。


讨论部分深入分析了技术创新的临床价值。首先,研究证实了深度特征提取可以绕过传统细胞形态学分析对核质比、染色强度等手工特征的依赖。其次,直接全切片分类策略避免了分割误差累积问题,这对存在大量重叠细胞的临床样本尤为重要。与既往研究对比显示,该方法准确率超越SqueezeNet(96.90%)、DenseNet-161(68.54%)等现有方案,

该研究的临床意义主要体现在三个方面:其一,高精度自动化筛查可缓解发展中国家病理医师短缺问题;其二,无分割流程简化了系统部署难度,更适应基层医疗机构需求;其三,模型在7分类任务中保持90%以上准确率,证明其识别癌前病变的潜力。未来研究可进一步扩大样本量,并探索Transformer等新兴架构的应用。这项成果标志着宫颈癌筛查向智能化、普惠化迈出了重要一步,为WHO提出的"消除宫颈癌"全球战略提供了关键技术支撑。
生物通微信公众号
知名企业招聘