基于损失函数的集成生成对抗网络模型提升精子形态学分类性能

【字体: 时间:2025年09月20日 来源:Advanced Intelligent Systems 6.1

编辑推荐:

  本文提出一种创新的基于损失函数的集成生成对抗网络(LB-EGAN)框架,通过融合DCGAN和DRAGAN两种模型优势,有效解决了生成对抗网络(GAN)训练中的模式坍塌(mode collapse)问题。研究采用空间增强与生成图像相结合的策略,在HuSHeM数据集上使Shifted Window Transformer(SWIN)模型分类准确率达到95.37%,为精子形态学异常诊断提供了更可靠的计算机辅助分析(CASA)解决方案。

  

1 引言

不孕不育已成为影响人类生活的重大健康问题,其中男性精子形态异常是重要致病因素。传统形态学评估依赖专家人工观察,存在主观性强、耗时久且成本高等局限性。计算机辅助精子分析(CASA)系统虽能部分解决问题,但设备昂贵且难以普及。近年来,深度学习技术在精子图像分类中展现出潜力,但其性能高度依赖训练数据规模。空间增强方法虽能扩充数据,但存在数据记忆化问题。生成对抗网络(GAN)通过生成合成图像为数据扩充提供了新思路,但传统GAN易出现模式坍塌现象,导致生成图像多样性不足。本研究旨在通过集成学习策略解决模式坍塌问题,提升精子形态分类的准确性与鲁棒性。

2 相关研究

2.1 精子形态学分类

早期研究主要采用图像处理技术分割精子头部进行分析,例如阈值分割法、自适应阈值法和霍夫变换等。随着深度学习发展,卷积神经网络(CNN)逐渐成为主流分类工具。研究者先后采用自定义CNN、VGG16、Vision Transformer(ViT)等模型,并引入集成学习方法结合多个模型输出。转移学习策略通过预训练模型显著提升了分类性能,而Transformer模型在图像分类中的成功应用进一步推动了该领域发展。

2.2 集成GAN

集成方法在GAN中的应用近年来受到关注,多个研究通过整合多个判别器来解决模式坍塌问题。例如使用双判别器架构、动态判别器数量控制以及联邦学习(FL)框架下的GAN模型。这些方法通过多样化判别视角增强了生成样本的多样性,为本文的集成策略提供了理论基础。

2.3 GAN在精子形态分类中的应用

尽管GAN在视觉任务中表现优异,但其在精子形态分类中的应用仍处于早期阶段。已有研究证明DCGAN能够生成合成精子图像,TransferGAN通过利用ImageNet数据集进行转移学习提升了生成质量。这些探索为本文研究提供了重要参考。

3 实验部分

3.1 数据集信息

研究采用Human Sperm Head Morphology(HuSHeM)数据集,包含正常、锥形、梨形和无定形四类精子图像,每类样本数约50-57张。图像通过Diff-Quik染色技术和奥林巴斯显微镜系统采集,存在相邻精子结构造成的噪声干扰。

3.2 数据增强

研究采用空间增强和GAN生成两种数据扩充方式。空间增强包括旋转、镜像、裁剪和亮度调整等操作。GAN增强则使用三种模型:DCGAN、DRAGAN和提出的LB-EGAN模型,每类生成500-2000张合成图像。

3.3 GAN模型架构

DCGAN采用卷积神经网络作为生成器和判别器;DRAGAN在DCGAN基础上增加梯度惩罚项;LB-EGAN通过集成DCGAN和DRAGAN的判别器损失,动态调整模型参数权重,计算公式如下:

S = 1/LD1 + 1/LD2

w1 = (1/LD1)/S

w2 = (1/LD2)/S

θLB-EGAN = w1θDCGAN + w2θDRAGAN

3.4 分类模型

研究采用五种先进分类模型:EfficientNet v2(中等和小型版本)、ResNet50、DenseNet201和SWIN Transformer。SWIN模型通过滑动窗口自注意力机制实现全局信息传递,在ImageNet预训练权重基础上进行微调。

3.5 实验设计

采用五折交叉验证防止数据泄露,测试集在增强前分离。评估指标包括准确率、精确度、召回率和F1分数,其中F1分数作为主要评价标准。

4 实验结果与讨论

实验结果表明,数据增强显著提升分类性能。无增强时SWIN模型准确率仅72.22%,加入10倍空间增强后提升至92.13%。进一步添加GAN生成图像后,LB-EGAN结合10倍空间增强使SWIN模型准确率达到94.44%。当融合三种GAN模型生成的6000张图像(每类2000张)与10倍空间增强时,SWIN模型取得最佳性能:准确率95.37%,F1分数95.38%。

不同分类模型中,SWIN Transformer表现最佳,EfficientNet v2M和v2S分别达到94.44%准确率,DenseNet201和ResNet50分别为93.98%和93.52%。研究表明,空间增强防止分类器过度依赖合成图像,而GAN生成图像则减轻了单纯使用空间增强导致的过拟合风险。

Inception Score评估显示,DCGAN为2.768±0.22,DRAGAN为2.834±0.22,LB-EGAN为2.890±0.18,而三模型融合达到3.002±0.20,表明集成方法不仅提升性能还增强稳定性。统计显著性分析显示,10倍增强与提出方法间的平均得分差异p值约0.002,证明多GAN模型策略的有效性。

与既往研究对比,Aktas等人采用ViT模型获得90.85%准确率;Ilhan等人通过集成学习达到92.13%;Abbasi等人使用GAN和分类流程取得95.10%验证准确率(但未采用交叉验证)。本研究结果超越了这些已有工作,仅低于Spencer等人通过手动旋转和堆叠集成获得的98.2%准确率。

5 结论

本研究提出的LB-EGAN框架有效缓解了GAN训练中的模式坍塌问题,通过集成学习和空间增强相结合的策略显著提升了精子形态学分类性能。Transformer模型对数据量和质量的高度依赖性在此得到验证,而多模型融合策略为小样本医学图像分析提供了新思路。未来研究方向包括开发条件GAN实现多类同步生成,进一步优化模型结构,以及推动实际临床应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号