通过整合分子和形态数据以及条形码选择方案,利用深度学习技术实现豆科植物的识别

《Journal of Systematics and Evolution》:Deep learning for Fabaceae identification by integrating molecular and morphological data and a solution for barcode selection

【字体: 时间:2025年10月31日 来源:Journal of Systematics and Evolution 2.9

编辑推荐:

  豆科植物鉴定结合形态与分子数据,利用深度学习模型分析ITS2和matK+rbcL条形码的属间区分能力,发现数据量不足导致过拟合,但验证了多源数据整合的有效性。

  

摘要

传统上,豆科植物的鉴定依赖于形态特征或DNA条形码技术,但这两种方法在准确性和效率方面都存在局限性。深度学习作为一种整合多种数据源的有前景的工具应运而生,但其全部潜力尚未得到充分探索。本研究旨在利用深度学习模型结合形态学和分子数据来进行豆科植物的物种鉴定,从而弥合这两种鉴定方法之间的差距。研究过程包括四个主要阶段:(i) 数据收集;(ii) 数据预处理;(iii) 模型训练与测试;(iv) 结果分析。数据来源于BOLD数据库中的DNA条形码序列,图像则从不同网站收集。该模型针对属和种两个层次进行了训练,使用了两种不同的条形码技术:ITS2和matK+rbcL。只有同时拥有四个ITS2、matKrbcL序列副本的物种被纳入分析,以确保样本间的数据一致性。最终数据集包含7个属和21个物种。虽然模型在训练阶段的准确率较高,但在测试阶段的准确率较低(14%–19%),这可能是由于数据集规模有限导致的过拟合现象。不过,该模型能够有效区分不同属之间的条形码特征。具体而言,研究发现ITS2和matK+rbcL在不同属上的识别效果存在差异。这些发现为深度学习在植物系统学中的应用开辟了新途径,不仅可用于物种鉴定,还可用于评估条形码的可靠性。这种方法有助于减少条形码选择中的试错次数,提升分子分类学的效率。

利益冲突

作者声明不存在利益冲突。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号