DeepFaune New England:一种用于北美东北部步道相机图像的物种分类模型
《Ecology and Evolution》:DeepFaune New England: A Species Classification Model for Trail Camera Images in Northeastern North America
【字体:
大
中
小
】
时间:2025年11月17日
来源:Ecology and Evolution 2.3
编辑推荐:
野生动物分类模型DeepFaune New England通过迁移学习适配北美新英格兰地区,使用公开数据集训练并达到97%准确率,支持PyTorch-Wildlife框架集成。
在过去的几年中,野生动物监测技术经历了显著的发展,尤其是在使用远程相机(trail camera)进行数据采集方面。这些设备能够以较低的成本,持续记录不同区域的生物活动,从而为生态研究和野生动物保护提供大量数据。然而,随着数据量的增加,图像标注成为了一个关键的瓶颈,尤其是在大规模和长期监测项目中。为了提高效率,研究人员开始利用机器学习(ML)技术来自动化识别过程,这不仅减少了人工标注的工作量,也加快了数据处理的速度,从而支持更及时的决策。
为了应对这一挑战,研究团队开发了**DeepFaune New England(DFNE)**,这是一个专门针对美国东北部地区的野生动物分类模型。该模型基于DeepFaune,后者是一个用于欧洲野生动物识别的自监督视觉变换器(ViT)模型。通过迁移学习的方法,研究者们对DFNE进行了再训练,使其能够准确识别美国东北部地区的24种常见物种,准确率达到97%。这一成果不仅展示了机器学习在生态监测中的强大潜力,也为区域性的物种识别提供了实用的解决方案。
DFNE的构建依赖于一个广泛的训练数据集,涵盖了来自多个项目的图像数据。这些数据主要来自公开的、经过许可的来源,并且部分数据来自于科学数据库和在线平台。在数据处理过程中,研究人员利用了MegaDetector这一对象检测工具,以识别图像中的动物位置,并通过手动标注和机器生成的标签相结合的方式,确保了数据的准确性和多样性。同时,为了解决数据集不平衡的问题,研究团队采用了重要性采样方法,将数据划分为训练集(80%)、验证集(10%)和测试集(10%),以保持各个分类的相对频率一致,并确保模型的泛化能力。
DFNE的训练过程采用了迁移学习策略,即基于已有模型(DeepFaune)进行再训练,使其适应新的数据。模型的最后全连接层被修改为包含24个输出节点,每个节点对应一个特定的物种分类。在没有直接映射关系的物种上,研究人员使用Xavier初始化方法进行权重设置,而在有映射关系的物种上,则使用与欧洲物种最相似的模型权重作为初始值。为了提高模型的鲁棒性,研究团队还对权重进行了随机扰动,使其能够更好地探索解决方案空间并避免过早收敛于局部最优解。
在模型训练和评估过程中,研究人员使用了随机梯度下降(SGD)优化器,学习率为1e-4,批量大小为16,并采用了加权交叉熵损失函数。经过25个训练周期后,模型在验证集上的准确率趋于稳定,最终在测试集上达到了97%的准确率。这种高准确率表明,DFNE能够有效识别各种动物,并在不同环境条件下保持良好的性能。尽管如此,模型仍然存在一些局限性,例如对某些物种的识别效果不佳,尤其是那些在数据集中样本数量较少的物种,如“Mouse sp.”(鼠类)和“No-species”(无物种)标签。
DFNE的开发不仅依赖于数据的收集和标注,也受益于开源社区的贡献。该模型已被集成到**PyTorch-Wildlife**框架中,这是一个专门用于处理远程相机数据的开源工具包。通过这一框架,用户可以更方便地使用DFNE进行动物检测、物种分类和后续的数据处理。此外,DFNE的代码和模型权重也通过USGS的科学数据库向公众开放,为其他研究者提供了使用和改进该模型的便利。
在实际应用中,DFNE的使用流程包括以下几个步骤:首先,使用对象检测模型(如MegaDetector)对图像进行分析,以定位动物;其次,利用DFNE对裁剪后的图像进行分类,生成预测结果和置信度评分;最后,对预测结果进行后处理,如将结果保存为COCO格式或其他适合导入数据库的格式。这些步骤的自动化大大提高了数据处理的效率,使得研究人员能够更快地获取物种分布和丰度的信息,从而支持更高效的生态监测和保护工作。
尽管DFNE在识别美国东北部地区的物种方面表现出色,但其在某些特定生态区域的应用仍需进一步验证。例如,模型未能涵盖半水生环境中的某些物种,如北美水貂、北美河狸和美洲水鼠等,这可能会影响其在这些区域的实用性。此外,一些在该地区边缘出现的物种,如加拿大猞猁,由于样本数量有限,未能被纳入训练数据集。因此,研究团队建议在这些情况下,用户应结合人工验证以确保分类的准确性。
DFNE的成功开发展示了开源软件和开放数据在推动高性能机器学习模型发展中的重要性。数据的收集、整理和标注通常是一项耗时且昂贵的任务,而开源工具的使用使得这些过程更加高效。同时,模型的开放性也促进了学术界的协作,为其他研究者提供了改进和扩展该模型的机会。未来,随着更多数据的积累,DFNE有望进一步扩展其分类范围,以涵盖更多物种,并提高对不同环境和数据采集方法的适应能力。
此外,DFNE的比较实验表明,虽然其在分类准确率上优于一些全球模型(如SpeciesNet),但在计算效率方面可能存在劣势。由于DFNE基于DINOv2 ViT架构,其参数量和计算复杂度均高于SpeciesNet所使用的EfficientNetV2-M架构。这意味着在资源有限的边缘设备上,SpeciesNet可能更具优势。然而,DFNE的高准确率使其在需要精确识别的区域应用中仍然具有不可替代的价值。
总之,DFNE的开发和应用为野生动物监测提供了一个高效、准确且可扩展的解决方案。它不仅解决了数据标注的瓶颈问题,还通过开源方式促进了科学界的共享与合作。未来,随着技术的进步和数据的丰富,DFNE有望成为区域野生动物监测的重要工具,为生态保护和管理提供更加精准的数据支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号