综述:基于CNN的深度学习模型在宫颈癌分析中的深入探讨
《Advances in Biomarker Sciences and Technology》:AN IN-DEPTH EXPLORATION OF CNN-BASED DEEP LEARNING MODELS IN CERVICAL CARCINOMA ANALYSIS
【字体:
大
中
小
】
时间:2025年11月20日
来源:Advances in Biomarker Sciences and Technology
宫颈癌是全球女性健康面临的重要威胁之一,位居女性癌症死亡的第四大原因。根据世界卫生组织(WHO)的统计数据,每年约有66万例新的宫颈癌病例被报告,导致约35万人死亡。早期检测对于降低死亡率至关重要,能够将死亡率降低高达80%。然而,目前医生主要依赖传统的Pap涂片检查和阴道镜图像分析来诊断宫颈癌,这些方法不仅耗时,且存在较高的误诊和漏诊风险,比例高达10%-30%。因此,探索更高效、准确的诊断方法成为医学界和科研人员的重要任务。
近年来,深度学习技术在生物医学领域展现出巨大的潜力,尤其是在医学图像分析、疾病预测和图像分割方面。人工智能驱动的诊断方法,如卷积神经网络(CNN)、密集网络(DenseNet)和U-Net等模型,已经在多个数据集上取得了超过95%的分类准确率。这些模型通过提取图像中的特征,能够更有效地识别异常细胞,提高诊断的客观性和一致性。本文旨在系统地回顾和分析用于宫颈癌识别与分析的深度学习策略,强调其性能指标、数据集和临床适用性。
### 1. 引言
#### 1.1 宫颈癌
宫颈癌是一种由异常细胞增殖引起的疾病,通常起源于子宫颈部位。它的发展过程涉及多个阶段,包括轻度不典型增生(CIN1)、中度不典型增生(CIN2)和重度不典型增生(CIN3),其中CIN3代表癌前病变或癌变的早期阶段。宫颈癌的诊断和治疗受到多种因素的影响,包括遗传、环境和生活方式等。虽然治疗手段不断进步,但全球癌症负担持续上升,每年新增数百万例诊断。因此,及时的检测和准确的诊断对于提高患者生存率和减轻医疗成本至关重要。
宫颈癌在发展中国家尤为严重,因为这些地区筛查不足和诊断延迟,导致更高的死亡率。生物标志物在宫颈癌的早期检测、诊断确认和疾病进展监测中发挥着关键作用。这些标志物可以是基因突变、蛋白质水平、代谢变化或影像特征,帮助分类疾病类型并指导个性化治疗。生物标志物的引入推动了精准医学的发展,但其在临床中的可靠验证和标准化仍然是一个挑战。
#### 1.2 宫颈癌筛查和诊断方法
目前,宫颈癌的筛查和诊断方法包括Pap涂片(Pap细胞学)、HPV筛查、双重检测(Pap细胞学和HPV筛查)、醋酸宫颈筛查、薄层细胞学(Thin Prep Cytology)等。Pap涂片是通过医生从宫颈取样后,在显微镜下检查细胞的形态学变化。这种方法可以发现不典型增生或癌变迹象,同时也能检测其他感染或炎症。然而,Pap涂片存在一定的局限性,如耗时、人为误差等。
HPV筛查则是通过检测宫颈细胞中是否存在高危型HPV病毒,来评估患癌风险。这种方法比Pap涂片更早发现HPV感染,但其准确性依赖于特定的检测方法。双重检测结合了Pap涂片和HPV测试,提高了检测的全面性,能够更准确地评估宫颈健康状况。醋酸宫颈筛查通过在宫颈上涂抹稀释的醋酸溶液,使异常细胞暂时变白,便于肉眼或放大设备下观察。这种方法能够快速识别病变区域,但其结果可能受到操作者经验的影响。
薄层细胞学是一种较新的方法,它通过液体基质保存细胞样本,提供更清晰的细胞图像,从而提高诊断的准确性和效率。这种方法在临床应用中表现出比传统Pap涂片更高的效果。此外,还有其他方法如阴道镜检查、碘试验(Schiller's test)和活检等,这些方法可以提供更详细的细胞结构信息,有助于进一步确诊。
### 2. 公共数据集描述
在宫颈癌的研究中,多个公共数据集被广泛使用。这些数据集不仅提供了丰富的图像信息,还帮助研究人员评估和优化深度学习模型的性能。以下是几个常用的数据集:
#### a) Herlev 数据库
Herlev 数据库由丹麦的 Herlev 大学医院开发,包含917张单细胞图像。这些图像由经验丰富的医疗技术人员和医护人员进行分类,分为七种类型:表面层鳞状上皮、中间层鳞状上皮、柱状上皮、早期非角化鳞状不典型增生、中期非角化鳞状不典型增生、晚期非角化鳞状异常细胞和鳞状细胞恶性病变。前三种类型代表正常细胞,其余四种类型代表异常细胞。
#### b) SIPaKMed 数据库
SIPaKMed 数据库包含4049张标记图像,由专家病理学家手工编辑自966张细胞图像。这些图像分为五类:两种健康细胞(外层和中间层)、两种不典型细胞(空泡型和角化异常型)和一种非恶性细胞(表型改变细胞)。该数据库为研究人员提供了丰富的细胞图像资源,有助于开发更准确的分类模型。
#### c) ISBI 2014 和 2015 挑战数据集
ISBI 2014 和 2015 挑战数据集专门用于宫颈细胞图像分割任务。ISBI 2014 数据集包含16张真实的宫颈细胞图像和945张生成图像,每张图像中的细胞数量在2到5之间。ISBI 2015 数据集包含九组真实的宫颈细胞图像,每组图像的细胞数量在2到10之间。这些数据集被广泛用于开发和测试精确的细胞分割和分类方法。
#### d) Intel & Mobile ODT 宫颈癌检查数据集
该数据集来自Kaggle平台,包含6734张标记图像,代表宫颈癌的三个阶段:CIN1、CIN2和CIN3。这些图像为研究人员提供了全面的数据支持,有助于探索深度学习模型在不同阶段的识别能力。
#### e) UCI 宫颈癌数据集
UCI 数据库包含858条记录,涵盖36个特征,其中32个是输入特征,4个是目标属性。该数据集收集自委内瑞拉中央大学(UCV),通过细胞学检查和活检等方法获取数据。该数据集在研究中被用于分析宫颈癌的临床特征和诊断方法。
#### f) 液基细胞学信息库
该信息库来自东北印度的三个医疗诊断中心,包括Babina诊断私人有限公司、加尔各答医学院和医院以及Dr. B. Barooah癌症研究所。该数据集包含963张图像,其中613张被标记为阴性,350张被标记为异常。异常图像进一步分为三种类型:严重鳞状不典型增生、早期鳞状不典型增生和鳞状细胞癌。该数据集为研究者提供了多样化的样本,有助于开发更全面的诊断模型。
### 3. 相关研究
近年来,许多研究致力于利用深度学习技术来诊断和分类宫颈癌。其中,Ming Fang等人提出了一种融合模块,用于宫颈细胞的分类。该模块结合了局部特征和整体特征,提高了模型的分类能力。在Herlev、CRIC和SIPaKMed等数据集上,该方法在5类、6类和2类分类任务中取得了优异的性能。
Siyi Chai等人设计了一种双路径判别检测网络,用于识别宫颈涂片中的异常细胞。该网络通过同时提取细胞和细胞核的特征,提高了模型的区分能力。在宫颈液基细胞学数据集和CRIC数据集上,该方法表现出优于其他先进方法的性能。
Anousouyadevei等人提出了一种改进的条件随机场和超像素驱动的分割方法,用于宫颈癌的诊断。该方法通过分割像素和超像素边缘数据,提高了模型对细胞核和细胞质的识别能力。该方法在Herlev数据集上取得了良好的效果。
Nina Youneszade等人设计了一种基于卷积网络的模型,用于识别宫颈病变。该模型通过优化特征提取,提高了识别的准确性。在Intel & Mobile ODT宫颈癌检查数据集上,该模型的准确率和敏感度均达到98%。
### 4. 医疗影像中的神经网络应用
在医疗影像领域,分割是一项关键任务。分割的目标是将图像划分为不同的区域,以便进行有效的细胞分析。传统方法依赖于简单的背景去除、细胞识别和边界检测,但这些方法在处理复杂的样本如Pap涂片时效果有限。因此,研究人员开发了更复杂和适应性强的分割方法。
#### a) ResNet
ResNet 是一种广泛应用于图像分类的深度神经网络模型。它通过残差学习和残差单元解决了非常深网络的训练难题。ResNet 的不同版本,如 ResNet-18、ResNet-34、ResNet-50、ResNet-101 和 ResNet-152,具有不同的网络深度。ResNet-50 模型在多个数据集上表现出色,尤其在分类任务中。
#### b) VGGNet
VGG-16 是由牛津大学视觉几何组开发的一种知名深度神经网络模型。它包含13个卷积层和3个全连接层,利用3x3卷积滤波器提取详细的图像特征。ReLU 激活函数加速了训练过程,而2x2池化操作有助于减少空间维度。
#### c) Google Net/Inception
Google Net,也称为Inception框架,是一种先进的卷积网络,利用Inception模块高效分析不同尺度的数据。该模块通过在相同层级使用不同大小的卷积滤波器,提高了模型的识别能力。该模型不仅深而且宽,能够识别复杂的图像结构。
#### d) U-Net 模型
U-Net 是一种专门用于图像分割任务的模型,其结构呈U形。它包含编码器和解码器两个部分,编码器通过卷积和最大池化操作减少输入尺寸并增加特征通道,而解码器通过上采样操作恢复图像尺寸,同时保留关键的空间信息。U-Net 的跳接连接有助于提高分割的准确性。
### 5. AI模型的评估
在评估AI模型的性能时,研究人员使用了多种指标,包括准确率、精确率、召回率、F1分数、敏感度、特异度、交并比(IoU)和Dice系数等。这些指标帮助研究人员衡量模型在分割和分类任务中的表现。
#### a) 准确率(Accuracy)
准确率是衡量模型整体性能的指标,表示正确预测的样本比例。在Herlev数据集上,ResNet-50模型的准确率达到97.5%,而U-Net模型在ISBI 2014和2015数据集上的准确率为92.6%-93%。
#### b) 精确率(Precision)
精确率衡量模型在所有正预测中正确识别的正样本比例。在Herlev数据集上,A2SDenseNet-121模型的精确率为99.75%,而在SIPaKMeD数据集上,该模型的精确率为99.14%。
#### c) 召回率(Recall)
召回率衡量模型在所有真实正样本中正确识别的样本比例。在Herlev数据集上,U-Net模型的召回率为92.3%-95.3%,而在SIPaKMeD数据集上,该模型的召回率为94.96%。
#### d) F1分数(F1 Score)
F1分数是精确率和召回率的调和平均,平衡了这两个指标。在Herlev数据集上,A2SDenseNet-121模型的F1分数为99.75%,而在SIPaKMeD数据集上,该模型的F1分数为99.14%。
#### e) 敏感度(Sensitivity)
敏感度等同于召回率,衡量模型识别所有真实正样本的能力。在Herlev数据集上,A2SDenseNet-121模型的敏感度为99.75%。
#### f) 特异度(Specificity)
特异度衡量模型正确识别所有真实负样本的能力。在Herlev数据集上,A2SDenseNet-121模型的特异度为99.75%。
#### g) 交并比(IoU)
交并比是衡量分割模型在预测区域和真实区域之间重叠程度的指标。在Herlev数据集上,U-Net模型的交并比为93.1%。
#### h) Dice系数(Dice Coefficient)
Dice系数是衡量分割模型重叠程度的另一种指标,类似于IoU,但更强调精确率和召回率的调和平均。在Herlev数据集上,U-Net模型的Dice系数为93.1%。
#### i) AUC(面积下曲线)
AUC 是衡量分类模型在ROC分析中区分能力的指标。在SIPaKMeD数据集上,A2SDenseNet-121模型的AUC为99.22%。
### 6. 深度学习模型在宫颈癌图像中的应用
不同的深度学习模型在宫颈癌图像分析中表现出不同的性能。ResNet-50、DenseNet-121和MobileNet-V2等模型在多个数据集上取得了较高的准确率。例如,DenseNet-121在Herlev数据集上的准确率达到99.75%,而在SIPaKMeD数据集上,其准确率为99.14%。U-Net模型在ISBI 2014和2015数据集上表现优异,准确率为92.6%-93%。
为了提高模型的性能,研究人员采用了多种预处理技术,如调整图像尺寸、归一化、数据增强等。此外,模型的评估方法也多种多样,包括K折交叉验证和留出验证等。这些方法有助于确保模型在未见数据上的泛化能力。
### 7. 结论
综上所述,深度学习技术在宫颈癌的诊断和分析中展现出巨大的潜力。尽管基于CNN的框架如VGGNet、ResNet和DenseNet在特征提取和分类任务中表现优异,但它们也面临诸如过拟合和高计算成本等挑战。轻量级和混合模型虽然在训练速度和可扩展性方面具有优势,但可能牺牲一些复杂的特征细节。此外,数据集的多样性和评估方法的一致性对模型的可比性和可靠性至关重要。
未来的研究应关注于开发标准化和多样化的数据集,整合多模态临床信息,并利用可解释性和隐私保护意识强的AI模型。此外,临床验证和获得监管批准对于AI驱动的宫颈癌诊断系统的实际应用至关重要。通过不断优化深度学习模型和数据集,有望进一步提高宫颈癌的早期检测率和诊断准确性,从而改善患者的预后和减轻医疗负担。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号