基于时序特征驱动的全幻灯片宫颈图像分级计算机辅助定量框架

《Scientific Reports》:Computer-assisted quantitative framework for whole slide cervical image grading driven by time series features

【字体: 时间:2025年10月15日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对宫颈薄层液基细胞学检测(TCT)中细胞级检测与整体诊断间的脱节问题,开发了一种结合多尺度注意力YOLO网络(MSA-YOLO)和长短期记忆全卷积网络(LSTM-FCN)的两阶段定量分析框架。通过引入马太效应量化DNA含量和时序特征,该模型在细胞级分类精度达0.8647,涂片级灵敏度达0.9285,实现了与12年经验病理医生相当的宫颈上皮内瘤变(CIN)分级性能,为宫颈癌筛查提供了可解释的定量标准。

  
宫颈癌作为全球女性第四大常见恶性肿瘤,2020年导致34.2万人死亡,发病率为每10万人13.1例。尽管世界卫生组织指出约90%的宫颈癌可通过早期筛查和疫苗等预防性临床管理手段有效避免,但现有的宫颈薄层液基细胞学检测(TCT)仍主要依赖细胞技师在玻片上筛查特定细胞类别,缺乏鲁棒性。当前诊断方法在不同层级上无法有机统一,细胞级的高精度无法有效反映在涂片级,且涂片级检测方法面临缺乏定量分析、模型可解释性不明确以及诊断标准固有缺陷等挑战。
针对这些挑战,研究人员开发了一种时序特征驱动的两阶段定量检测框架。该框架首先利用带有注意力模块和多尺度特征融合的YOLO网络(MSA-YOLO)增强表示细化,提高宫颈细胞分类精度(达0.8647)和真阳性率(达95.8%)。随后引入定量DNA描述,利用马太效应细化诊断贡献,建立更清晰的细胞增殖评估标准。通过提取时序特征并利用全局涂片信息,该模型增强检测鲁棒性,丰富筛查系统,并抵抗假细胞分类影响(涂片级准确度、灵敏度和特异性分别达0.9193、0.9285和0.9234)。
研究团队在572个临床病例数据集上验证了框架性能,其中广东省人民医院(GPPH)数据集322例,北京大学第三医院(PUTH)数据集250例。采用自组装扫描系统将玻片数字化为700个非重叠图块(1200×1600像素,200倍放大),共收集400,400个临床 patches。
关键技术方法包括:1)多尺度注意力YOLO网络(MSA-YOLO)用于细胞级检测,集成U型注意力模块和重构损失函数;2)基于Lambert-Beer定律的DNA定量分析,计算DNA指数(DI)和积分光密度(IOD);3)马太效应概率函数优化细胞贡献度;4)长短期记忆全卷积网络(LSTM-FCN)处理时序特征进行涂片级分类;5)采用序列模型优化(SMBO)进行超参数优化。
细胞级分析与检测结果
通过消融实验验证了注意力模块和重构损失函数的有效性。未使用注意力模块时,HSIL的平均精度(AP)从0.8634显著降低至0.7737,表明多尺度特征图与注意力模块通过强调关键特征(如核形态、染色质纹理和细胞排列)并抑制不必要特征(如成像伪影、染色强度和一些结构成分),增强了网络在细胞级分类中的表示能力。
与不同骨干网络的YOLO网络对比表明,MSA-YOLO在平均精度(AP)值上显著优于其他骨干模型。具体而言,相比YOLO网络,注意力模块将所有骨干模型的AP平均提高了5.6%。MSA-YOLO结合注意力模块和改进的损失函数,AP比骨干网络提高11.358%,在DarkNet53上达到0.8647的AP,高于原始YOLO的0.7462。
定性结果分析
为展示MSA-YOLO在细化中间特征嵌入方面的功效,图11显示了卷积后调整大小的多尺度融合特征。正常病例(案例1-4)的特征图精确且明确,展示了该方法在减少假阴性方面的功效。案例5-8和9-12由于生理特征相似出现特征重叠,区分存在挑战。案例13-16中,后层的特征图显示出更清晰的区分。虽然临床分类在常见组内可能存在分类模糊性,但该框架在全局范围内深度挖掘时序特征,仍然对容易出错的细胞分类具有韧性。
案例级结果与比较
使用PUTH数据集检验TSS框架的涂片级分类性能。MSA-YOLO获得相对较高的灵敏度0.9285,优于一般病理医生的灵敏度(0.5-0.8),同时特异性达到可接受的0.9234。该模型在高风险癌类型(CIN 2/3)上操作更好,检测有争议的基底病例的Sn_H达到0.9325,使框架非常适用。
深度学习模型在AUC和准确度方面优于机器学习方法,MSA-YOLO达到最高的AUC 0.9358,Transformers具有最高的准确度0.9240。尽管Autoencoder和Transformers在特定指标包括准确度和Sn_C上优于MSA-YOLO,但该方法在检测潜在阳性病例方面的更强能力在临床场景中仍然非常重要。
研究结论表明,该时序驱动的筛查框架通过多尺度注意力YOLO网络和LSTM-FCN网络的结合,显著提升了宫颈细胞分类的准确性和涂片级分级的鲁棒性。通过马太效应量化DNA含量和时序特征,为宫颈癌筛查提供了可解释的定量标准,实现了与经验病理医生相当的诊断性能。该框架易于集成到医疗环境中,提供定量DNA描述并增强用户信心。
讨论部分指出,虽然本研究实现了临床相关的宫颈癌检测性能,但最终诊断仍需阴道镜验证。限制包括:1)TCT涂片可能无法完全捕捉宫颈管状况,可能导致遗漏病变;2)当前框架的计算复杂度需要大量硬件资源,影响处理速度和在欠发达地区的可扩展性;3)两阶段系统优化可能无法探索完整的解决方案空间,可能导致次优结果;4)需要进一步分析细胞时序特征以增强当前诊断原则的模型可解释性。
未来计划包括开发一个可解释模型进行深入分析,设计一个用于全幻灯片图像检测的系统,保持敏感性和效率,并将时序特征与HPV检测结合用于临床筛查模拟,扩展该方法到使用TCT检测其他癌症如泌尿系统或食管癌。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号