
-
生物通官微
陪你抓住生命科技
跳动的脉搏
GAN-RES网络构建及其在稀缺样本蜓类化石识别中的应用研究
【字体: 大 中 小 】 时间:2025年08月05日 来源:Ecology and Evolution 2.3
编辑推荐:
这篇研究创新性地将生成对抗网络(GAN)与残差网络(ResNet50)、高效网络(EfficientNet)及定制化卷积神经网络(CNN)相结合,提出GAN-RES框架,解决了古生物学中稀缺化石样本识别难题。通过GAN生成逼真虚拟图像扩充数据集,结合迁移学习技术,模型在16属蜓类化石识别中达到93%准确率,显著优于传统数据增强方法,为小样本古生物智能鉴定提供了新范式。
古生物学研究长期依赖专家经验进行化石鉴定,传统智能识别方法需大量样本训练。针对稀缺化石样本识别难题,研究团队以蜓类化石为对象,基于当前最大数据集"Fusulinid images 2400—NJU"(含16属4800张图像),创新提出GAN-RES框架。该框架通过深度卷积生成对抗网络(DCGAN)生成虚拟样本,结合ResNet50、EfficientNet和定制CNN架构,突破小样本学习瓶颈。
实验采用7:1.5:1.5比例划分训练/验证/测试集。数据集涵盖蜓类6亚科16属,每属含300张原始图像及灰度版本,包括显微镜照片和文献扫描图像。
DCGAN生成器通过500轮训练达到判别器损失值50%的平衡状态,生成1000张/属虚拟图像。关键创新在于:
生成器采用多层逆卷积结构
判别器使用多层卷积网络
集成框架中EfficientNet冻结前80%层,ResNet50冻结71%层
图像统一调整为128×128像素,采用旋转、翻转等传统增强方法,并随机调整亮度/对比度。通过归一化处理提升模型训练效果。
采用迁移学习技术:
DCGAN阶段:批量大小50,StepLR动态调整学习率
分类模型阶段:加载ImageNet预训练参数,微调网络层
在100训练周期下取得显著成果:
平均准确率93%
部分属识别性能突出:Eostaffella/Misellina/Nankinella达99% F1值
争议属识别:Pseudofusulina与Schwagerina混淆率最高(76% F1值)
特征可视化显示:
UMAP降维图中争议属分布重叠
GradCAM揭示模型关注房室隔板(spirotheca)等关键形态特征
模型识别错误与专家争议高度吻合,证实其生物学合理性。如:
Pseudofusulina与Schwagerina因房室结构相似易混淆
Eoparafusulina与Triticites存在12%交叉误判
相比传统方法:
数据量需求降低80%
识别效率提升15倍
克服薄片角度造成的形态变异问题
研究构建的GAN-RES框架:
突破古生物样本稀缺限制
建立形态特征-分类结果的量化关联
为古生态/古环境研究提供自动化工具
未来可扩展至其他微体化石分类,但新分类单元鉴定仍需专家介入。该成果发表于《Ecology and Evolution》,获吉林省科技厅项目支持。
生物通微信公众号
知名企业招聘