用于从野生灵长类动物的面部图像中预测年龄的视觉变换器
《Methods in Ecology and Evolution》:Vision transformers for age prediction from facial images in a wild primate
【字体:
大
中
小
】
时间:2025年11月07日
来源:Methods in Ecology and Evolution 6.2
编辑推荐:
本研究利用深度学习模型评估预测野生刚果兰博妇年龄的潜力,发现DINOv2-LARGE模型在0-24岁年龄范围内平均绝对误差为213天,优于其他CNN和Transformer模型。分析表明背景信息对预测影响不显著,但年龄和性别差异导致预测误差增大,且母体年龄与幼崽预测误差正相关。该方法为野生动物非侵入式年龄估算提供了新工具。
在生态学、行为学以及保护科学中,准确估算个体年龄是一项关键任务。然而,当出生日期未知时,估算生物的生理年龄通常依赖于死后形态学分析,或者采用侵入性且繁琐的技术手段。为了解决这一问题,我们探索了深度学习技术在照片图像分析中的应用潜力,用于非侵入性地预测个体的年龄。通过比较几种最新的深度学习模型,我们利用284个已知年龄个体的25,500张野生 mandrill(一种猴子)的照片,发现基于 transformer 架构的 DINOv2 模型在性能上远超卷积神经网络(如 ResNext、ConvNeXt、EfficientNetv2)和其他流行的 transformer 模型 VOLO。这表明,现代人工智能技术为估算野生动物的生理年龄提供了一种简单、低成本且非侵入性的方法,并且可以通过预测的年龄与实际年龄之间的差异,为行为生态学家研究个体成长、发育速度以及生物老化过程提供新视角。
在野生动物研究中,年龄估算对理解种群动态、评估个体适应性以及制定保护策略至关重要。例如,年龄可以用来估算种群增长速度和生存概率,这些信息对于渔业资源管理或野生动物保护中的种群可行性分析非常重要。然而,直接估算野生动物的生理年龄仍然充满挑战,传统方法往往受限于在自由活动环境中难以准确实施,或者需要侵入性采样,这在野外研究中可能不切实际或存在伦理问题。此外,纵向研究需要大量时间和资源,因此开发一种非侵入性、可扩展且适用于多种物种的方法成为迫切需求。
在人类中,面部图像分析用于年龄预测已有多年的研究历史,从手动特征提取发展到基于人工智能的自动化系统。近年来,人工智能在这一领域的进展显著,利用大量图像数据来捕捉复杂的衰老模式。例如,一个卷积神经网络(CNN)在训练时使用了眼睛角这一对人类衰老最敏感的面部区域,可以对20至80岁个体的年龄预测误差为2.3年。而另一项研究则发现,基于 DNA 甲基化的年龄预测误差为2.7年。这说明,在野生动物中,图像分析仍然是一种有前景的方法,尽管目前仅有少数研究涉及。
为了进一步探索图像分析在野生动物中的潜力,我们使用了多种深度学习模型,包括 CNN 和 transformer。其中,transformer 模型因其能够处理复杂的视觉模式而备受关注。transformer 模型的引入标志着计算机视觉领域的重要变革,它将原本用于文本分析的注意力机制应用于图像数据。与传统的 CNN 不同,transformer 模型将图像分割为小块,将每个块视为序列(类似句子中的单词),并利用这些块之间的关系来捕捉复杂的模式和上下文依赖。这种方法使 transformer 模型能够学习更复杂、更全局的视觉信息,这对需要细微区分纹理、形状和环境背景的任务尤为重要。这也是为什么在人类面部年龄预测中,当前最先进的模型是基于 transformer 架构的 VOLO-D1,其预测误差为4.2年。
本研究有两个主要目标:首先,评估最先进的 AI 方法在预测野生 mandrill 年龄方面的性能;其次,分析模型如何做出预测,以及与 mandrill 生物学相关的因素如何影响预测的准确性。为了达到这些目标,我们使用了 Explainable AI 技术,研究了面部和背景像素在图像中对年龄预测的贡献。这使我们能够识别模型是否采用了“捷径学习”策略,即通过简单、非鲁棒的规则来完成任务,而不是学习复杂的逻辑关系。例如,一个模型如果在训练时只接触到雪地背景的狼照片,它可能会将雪视为“狼”的标志,而非真正学习面部特征。尽管模型在某些情况下会利用背景信息进行预测,但我们发现,背景对整体预测准确率的影响并不显著,且在有或无背景的情况下,预测误差无明显差异。
此外,我们还研究了生物学因素对预测误差的影响。在个体层面,预测误差在时间上保持了一致性:那些在年轻时看起来比实际年龄更大的个体,在整个生命周期中也持续表现出这种趋势。同时,我们发现,母亲年龄较大的个体所生的幼崽在预测年龄上也表现出更大的年龄偏差,这与之前关于 mandrill 群体中母体年龄与后代发育之间的关联研究一致。这些结果表明,模型的预测误差不仅与图像特征有关,还可能受到个体的生物学特性影响。
总体来看,这些结果表明,现代的人工智能方法为野生生物的年龄预测提供了一种高效且非侵入性的工具。通过将预测的年龄与实际年龄进行对比,我们可以揭示个体成长、发育速度和老化过程的差异。此外,这些模型的广泛应用可能为行为生态学研究提供新的视角,帮助科学家更好地理解个体行为与生理状态之间的关系。在生态学研究中,这些模型能够提供一种非侵入性、可扩展的方法,从而减轻对野生动物的干扰,提高数据采集的效率。
研究过程中,我们使用了 Mandrillus Face Database(MFD)中收集的 284 个个体的照片,这些照片涵盖了从出生到 16.4 年的男性和从出生到 23.6 年的女性。我们对模型进行了多种测试,包括使用不同深度和参数数量的 transformer 变体(如 DINOv2 的 SMALL、MEDIUM 和 LARGE)以及卷积神经网络。最终,DINOv2-LARGE 模型在所有测试中表现最佳,其平均绝对误差(MAE)为 213.4 天,且累积分数(CS)达到了 94.2%。相比之下,其他模型的预测误差较高,说明 DINOv2 在年龄预测任务中具有显著优势。
在分析模型预测的可靠性时,我们发现背景信息对预测结果的影响微乎其微,尽管在某些情况下,背景特征可能偶尔对预测产生影响。然而,总体而言,模型的预测主要依赖于面部特征,而不是背景信息。这一发现对于野生动物研究尤为重要,因为在野外,个体经常处于不同的环境中,背景可能包含大量非相关信息。因此,我们的模型能够在没有背景干扰的情况下保持高预测精度,这为未来在实验室环境中应用这些模型提供了依据。
此外,我们还分析了不同年龄组的预测误差。结果显示,随着年龄的增长,预测误差逐渐增加,尤其是在女性中更为明显。这可能与 mandrill 的发育速度和生理变化有关。同时,我们发现,个体的预测误差在时间上保持一致,即那些在年轻时看起来比实际年龄更大的个体,在后续的年龄阶段中仍然表现出这种趋势。这表明,年龄预测的误差并非随机发生,而是可能反映了个体的发育特征。在一些情况下,母亲的年龄和地位对幼崽的预测误差也产生了显著影响,这可能与遗传因素、母体行为和环境影响有关。
这些研究结果不仅对 mandrill 的年龄预测具有重要意义,也为其他野生动物的年龄估算提供了新的思路。随着人工智能技术的不断发展,未来可能会有更多适用于野生动物的非侵入性年龄预测工具出现。此外,这些模型的可扩展性和非侵入性特点,使其成为长期生态研究的理想选择。通过将外部表型特征与内部生理指标和生命周期特征相结合,这些模型能够为生态学研究提供新的视角,帮助科学家更深入地理解野生动物的发育和老化过程。
总的来说,这项研究展示了人工智能在野生动物年龄预测中的巨大潜力。通过使用非标准化的图像数据,我们不仅验证了 transformer 模型在这一任务中的优越性,还揭示了模型预测误差背后可能的生物学原因。这些发现为行为生态学和保护科学提供了新的研究工具,使科学家能够更有效地分析个体的发育过程,并探索年龄与行为、生理状态之间的关系。随着 AI 技术的进一步发展,我们可以期待这些方法在更多野生动物研究中的应用,从而推动生态学和保护科学的进步。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号