结合机器学习技术以加强边缘化城市社区中的啮齿动物监测
《Ecology and Evolution》:Incorporating Machine Learning Techniques to Enhance Rodent Surveillance in Marginalized Urban Communities
【字体:
大
中
小
】
时间:2025年11月01日
来源:Ecology and Evolution 2.3
编辑推荐:
高效监测鼠类种群的技术方法研究,采用机器学习整合追踪板分析,通过主成分分析(PCA)、独立成分分析(ICA)和Legendre矩(LM)提取图像特征,并利用k最近邻算法分类,显著提升评估效率(传统需2周人工判读,ML仅需1天)和准确性(达91.8%),为低收入国家提供低成本、易操作的鼠类种群监测方案,助力疾病防控
在当今全球环境变化日益加剧的背景下,鼠类等小型哺乳动物的繁殖与活动对农业、公共卫生以及社会经济带来了深远的影响。鼠类不仅会造成巨大的经济损失,还可能传播多种人畜共患病,威胁人类健康。因此,对鼠类种群进行高效、准确的监测和评估,对于制定有效的鼠害控制策略具有重要意义。然而,目前用于评估鼠类种群的许多方法存在一定的局限性,例如传统的鼠类捕捉方法需要大量的人力物力,而鼠迹板(Tracking Plates, TPs)虽然能提供较为准确的信息,但其解读过程需要高度专业的技能,并且耗时较长。鉴于这些挑战,科学家们开始探索将机器学习(Machine Learning, ML)技术引入鼠类监测,以提高效率并减少人为误差。
本文提出了一种将机器学习与鼠迹板结合的新方法,旨在通过图像处理和数据分析,实现对鼠类活动的快速识别和分类。这种方法的核心在于利用图像处理技术将鼠迹板从RGB彩色图像转换为灰度图像,从而突出感兴趣的区域。随后,通过全局阈值处理生成二值图像,使得图像中的鼠类痕迹更加清晰。为了进一步提取图像中的关键特征,研究者采用主成分分析(PCA)、独立成分分析(ICA)以及Legendre矩(LM)等方法进行特征降维,从而减少数据复杂性并保留重要的信息。
在特征提取阶段,PCA通过识别高维数据中的主要模式和相关性,将原始数据转换为一组不相关的主成分,从而实现对图像特征的压缩和优化。ICA则通过线性分解随机向量,将数据分解为尽可能独立的成分,这在处理图像中的非线性变化方面具有优势。而Legendre矩方法则通过计算图像在极坐标系下的投影,提取出具有旋转不变性的特征,有助于识别不同方向上的鼠类痕迹。这些方法的结合,使得研究人员能够从鼠迹板中提取出更为精确的特征,用于后续的分类任务。
为了实现分类,研究者采用了*k*-最近邻(*k*-Nearest Neighbors, *k*-NN)算法,该算法基于相似性原则,通过计算新数据点与已知数据点之间的距离,进行分类决策。研究结果显示,PCA和Legendre矩在分类精度方面表现优于ICA,尤其是在识别鼠类痕迹的准确性和速度上。PCA仅需22个特征即可达到91.80%的准确率,而Legendre矩则在22个特征下达到88.71%的准确率。相比之下,ICA在相同条件下仅能实现66.03%的准确率,说明其在处理鼠迹板图像时的效率和效果不如其他两种方法。
此外,研究还发现,随着训练数据量的增加,PCA和Legendre矩的分类性能逐渐提升,并在训练数据达到一定比例后趋于稳定。这表明,这两种方法在处理鼠迹板数据时具有较好的泛化能力,能够适应不同规模的数据集。而ICA的性能则相对较低,即便使用80%的训练数据,其准确率仍无法达到PCA和Legendre矩的水平。因此,PCA和Legendre矩成为本研究中更为推荐的特征提取方法。
在实际应用中,这种基于机器学习的鼠迹板分析方法不仅能够显著减少分析所需的时间,还能够提高分析的准确性和一致性。传统的人工分析方法需要两个经验丰富的评估者花费超过两周的时间才能完成对1675块鼠迹板的评估,而基于机器学习的方法仅需不到一天即可完成相同任务,且结果的准确性与人工分析相当。这一结果表明,机器学习技术可以有效替代或辅助人工评估,从而在资源有限的地区,尤其是低收入和中等收入国家(Low- and Middle-Income Countries, LMICs)中发挥重要作用。
同时,本研究也指出了机器学习在鼠类监测中的潜在优势。首先,机器学习能够减少人为误差,提高结果的可靠性。其次,它能够识别人工难以察觉的细微痕迹,从而提升鼠类活动的检测能力。再者,该方法的自动化特性使得监测过程更加高效,能够快速生成结果,为鼠类管理提供及时的数据支持。在公共卫生领域,这种快速且准确的监测方法可以更有效地追踪鼠类的分布热点,为疾病防控提供科学依据。
尽管本研究取得了令人鼓舞的成果,但其方法仍存在一些局限性。例如,当前的机器学习模型无法区分具体的鼠类物种,仅能识别其存在与否。这种非物种特异性限制了方法在某些需要精确物种识别的场景中的应用。因此,未来的研究需要进一步探索如何在保持高效率的同时,实现对鼠类物种的识别。此外,由于鼠迹板的标记可能受到环境因素的影响,例如雨水的冲刷,因此需要在实际应用中考虑这些因素,并通过改进实验设计或引入更鲁棒的图像处理技术来减少环境干扰。
综上所述,将机器学习技术应用于鼠迹板分析,为鼠类监测提供了一种高效、准确且可扩展的新方法。这种方法不仅能够减轻人工分析的负担,还能提高数据处理的效率和准确性,为公共卫生和生态保护提供有力的技术支持。未来的研究可以进一步优化特征提取方法,提高模型的物种识别能力,并探索其在更大规模数据集中的应用潜力,从而推动鼠类监测技术的持续发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号