综述:人工智能时代生物分类学的进展:深度学习应用、挑战与未来方向

《Science China-Life Sciences》:Advancing biological taxonomy in the AI era: deep learning applications, challenges, and future directions

【字体: 时间:2025年10月26日 来源:Science China-Life Sciences 9.5

编辑推荐:

  本综述系统梳理了人工智能(AI)驱动下生物分类学的范式变革,重点探讨深度学习在图像、生物声学、基因序列分类及物种性状解析等四大领域的突破性应用。文章指出,将基因组视为"语言"的基础模型(Foundation Models)正推动分类标准向数据驱动范式转变,同时强调分类学家在引导AI模型发展中的关键作用。面对数据质量、算法鲁棒性等挑战,构建全整合、因果关系认知模型将成为下一代分类学的核心方向。

  

Abstract

生物分类学正面临历史转折点。本综述追溯了其经历三个技术驱动时代——形态学时代、分子生物学时代以及当今人工智能(AI)驱动时代的发展脉络,阐明了每种技术工具集的迭代呈现互补性拓展而非简单替代。深度学习技术通过四大应用维度重塑分类学范式:基于生物图像的分类、基于生物声学的分类、基于基因序列的分类以及物种性状解析。将基因组视为"语言"的基础模型,已开始揭示序列变异与蛋白质结构、表型和生态位之间的关联,预示着物种界定标准将转向更本质的数据驱动范式。我们重点分析了深度学习与基础模型的最新突破,指出全整合且具备因果关系认知能力的模型可能引发分类学的阶跃式发展。但当前仍存在数据质量、算法鲁棒性、参考库完整性、模型可解释性等关键挑战。分类学家对性状演化的深刻理解,使其在AI与分类学融合进程中具有独特价值,特别是在指导基础模型开发方面。随着AI向复杂生物因果关系推理演进,甚至核心分类学概念也可能重构——认知并引领这场变革,正是AI时代赋予分类学的挑战与机遇。

技术驱动下的分类学演进

生物分类学的发展始终与技术革命同频共振。形态学时代依托标本形态特征构建分类体系,分子生物学时代通过DNA条形码等分子标记提升鉴定精度,而当前AI时代则通过深度学习实现多源数据的融合分析。值得注意的是,新技术工具集呈现累积式发展特征,例如形态学特征在卷积神经网络(CNN)图像识别中仍发挥重要作用,而分子数据则成为Transformer架构处理基因组"语言"的基础原料。

深度学习的四维应用场景

在生物图像分类领域,卷积神经网络(CNN)和视觉Transformer(ViT)已实现对物种显微图像、野外照片的高精度识别,甚至能从化石碎片中重建形态演化轨迹。生物声学分类通过循环神经网络(RNN)处理鸟类鸣唱、鲸类声呐等声音信号,突破了传统声谱分析的局限性。基因序列分类则利用自然语言处理(NLP)技术,将DNA序列视为生物学"语言",通过基因BERT等模型挖掘序列变异与系统发育的隐含关联。最具突破性的是性状解析方向,图神经网络(GNN)正构建性状-基因-环境的多维关联图谱,为功能分类学提供新范式。

基础模型与数据驱动范式

将基因组视为生物学"语言"的基础模型(如DNABERT、Nucleotide Transformer)展现出惊人潜力。这些模型通过自监督学习在数十亿碱基序列上预训练,能够捕捉从点突变到基因重组的多尺度变异规律。研究表明,模型隐含空间可映射到蛋白质三维结构变化,并进一步关联表型差异和生态位适应。这种"序列-结构-功能"的跨层级推理能力,暗示着未来可能建立基于数据本质特征的物种界定标准,突破传统分类学中人为设定阈值的主观性。

挑战与协同进化路径

尽管前景广阔,AI分类学仍面临多重挑战:样本偏差导致模型泛化能力不足,长尾物种数据稀缺影响稀有物种鉴定,黑箱模型决策过程难以与传统分类知识对接。此外,参考基因组库的覆盖度不足、不同数据库标准差异等问题也制约着模型性能。解决这些挑战需要分类学家与AI研究者的深度协同——分类学家通过性状演化知识指导特征工程,参与可解释AI(XAI)模型构建,而AI系统则可辅助发现性状相关的新规律,形成"人类专家认知+机器智能"的双驱动模式。

未来方向:因果关系认知与概念演进

下一代分类学模型将趋向全整合与因果关系认知。融合多组学数据(基因组、转录组、蛋白组)与环境因子的多模态学习,有望构建物种形成的动态模型。更重要的是,引入因果推断技术可区分性状间的相关性与因果性,例如解析特定生态压力与形态适应的驱动关系。这种变革可能促使核心分类概念重构:物种界定标准或将从静态形态特征转向动态演化轨迹,分类系统或将整合适应性进化与系统发育信息。这种根本性变革既要求技术突破,更需要学科范式的协同演进。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号