综述:新一代标本数字化:从世界植物标本馆捕获反射光谱以模拟跨时间、空间和类群的植物生物学

《New Phytologist》:Next-generation specimen digitization: capturing reflectance spectra from the world's herbaria for modeling plant biology across time, space, and taxa

【字体: 时间:2025年11月02日 来源:New Phytologist 8.1

编辑推荐:

  本综述系统阐述了植物标本反射光谱数字化这一前沿领域,旨在将全球植物标本馆的海量标本转化为可挖掘的光谱信息库。文章由国际植物标本光谱数字化(IHerbSpec)工作组牵头,核心在于通过标准化流程获取植物标本的反射光谱(400–2500 nm),从而无损估测植物功能性状(如氮、磷、木质素含量),辅助物种鉴定与分类,并整合基因组、环境数据,最终构建可追溯时空演变的“全球元植物标本馆(global metaherbarium)”。该计划遵循FAIR(可发现、可访问、可互操作、可重用)原则,有望革新植物生态学、进化生物学及生物多样性监测研究。

  
在全球变化和生物多样性丧失的时代,植物标本馆作为记录植物形态、分布以及新型数字化应用的知识宝库,其重要性日益凸显。国际植物标本光谱数字化(IHerbSpec)工作组的成立,标志着植物科学研究进入了一个新的阶段——下一代标本数字化,其核心是从全球植物标本馆的标本中捕获反射光谱,从而跨越时间、空间和分类群来建模植物生物学。
I. 引言
植物标本馆保存着约4亿份标本,是研究植物表型和功能性状时空变异的宝贵资源。传统上,标本主要用于形态学和分布研究,但随着技术进步,如全基因组测序和代谢组学方法已能应用于数百年前的标本。反射光谱作为一种新兴的数据类型,能够整合从叶片到生物圈尺度的植物多样性信息。将光谱信息纳入“扩展标本概念”,可以将其与标本的采集时间、地点和环境联系起来,为宏观生态和生物地理学研究提供支持。然而,要实现光谱数据的全球整合,必须建立统一的协议和标准,避免因仪器、光学设置或测量方案的不同而导致的数据聚合问题。
II. 生态与进化中植物性状应用的扩展
植物性状是理解生态过程(如与环境、草食动物、传粉者的相互作用)和生态系统功能的关键。全球植物性状数据库(如TRY、BIEN、AusTraits)已大量积累数据,但存在采样偏差,尤其在热带地区和稀有物种中代表性不足。植物标本馆的标本可以系统性地获取这些难以获取的物种的功能性状数据,填补全球空白。植物经济学谱揭示了植物资源获取和生态功能的一致性模式,这些模式影响着物种沿环境梯度的分布,并为群落聚集、植被动态和生物圈功能模型提供信息。
III. 什么是反射光谱?
反射光谱是测量从表面返回到传感器的电磁辐射(光),解析为数百个仅几纳米宽的窄波段。植物组织因其不同的结构、解剖、细胞器和生物分子组成而具有独特的光谱特性。光谱数据已广泛用于估算植物的结构、化学和生理性状,并提供关于分类学身份、系统发育位置、防御化学以及与遗传或地理变异相关的表型变异的信息。从新鲜叶片获得的光谱与从压制干燥叶片获得的光谱不同,主要由于干燥过程中水分、色素和结构的变化。干燥叶片通常能更准确地预测大量营养素、微量营养素以及碳或氮稳定同位素。
IV. 从植物标本光谱估算植物性状
过去十年的技术进步为应用光谱生物学于植物标本以预测植物功能奠定了基础。早期对干燥叶片的光谱研究为将光谱与性状联系起来的方法做出了贡献。最近的研究表明,使用基于硅胶干燥叶片光谱训练的机器学习模型可以预测热带树种的性状。类似的结果在温带森林物种的大量未装订压制叶片数据集中也得到了验证。随后,研究证明使用来自数十年历史的植物标本标本的离体叶片的光谱模型可以准确预测关键性状,如叶片质量每面积。应用工作流程来预测不同储存条件下植物标本的叶片性状,展示了追踪叶片碳、氮和磷含量时间趋势的潜力。
V. 将光谱特征应用于表型-基因型关联和进化模型
将光谱学的表型数据与遗传和基因组信息相结合,有助于确定影响潜在性状的生态因素和进化过程。光谱数据可以揭示与生态位相关的性状变异,而基因组数据则提供了这些性状背后的遗传结构信息。例如,在Quercus subsection Virentes的近缘种中,光谱表型分化与特定的微生境相关,由对生态变异的局部适应所塑造。光谱数据也可用于使用比较方法在系统发育树上模拟物种性状。当光谱在不同物种间一致测量时,光谱衍生的性状(或光谱指数本身)可用于模拟进化速率、进化约束和选择。将高维光谱数据纳入系统发育比较框架是一个挑战,需要新的比较方法。
VI. 物种发现与鉴别
光谱数据已成为评估和完善分类学假设的宝贵工具,包括物种界定、分类学修订和隐性多样性的检测。在亚马逊地区,研究人员使用傅里叶变换近红外(FT-NIR)光谱仪分析了未装订叶片样本的光谱吸收谱,以区分Eschweilera属内的近缘种。类似的方法也被应用于压制蕨类植物叶片的物种分类。光谱数据与DNA数据的整合有助于解决物种复合体中的分类学问题。对植物标本的应用较新,研究表明,来自不同年龄和来源的植物标本叶片的光谱模型可以将标本分类到物种(准确率高达74%)和属(高达84%)。在未来,结合数字图像和光谱谱将提高我们在不同分类水平上的辨别能力。对于植物系统学家来说,这些进展代表了用新的眼光重新探索植物标本馆收藏的重大机遇。
VII. 聚合和扩展光谱数据的益处与挑战
尽管人们对植物标本光谱数据集的收集和应用感到兴奋,但仍存在方法学、材料和数据处理方面的挑战。光谱测量记录了目标表型的信息,但仪器、标本保存和数据处理流程的差异引入了额外的变异性,使大规模数据聚合和跨机构兼容性复杂化。挑战包括:叶片表型因环境、叶片年龄/发育阶段而产生的变异;标本年龄导致的化学降解;标本馆之间保存方法的差异(如干燥、消毒方法、粘合剂);仪器和光学器件的差异(如信噪比SNR、视场FOV、光谱范围和分辨率);以及反射背景的影响。为解决这些问题,需要制定共享协议和元数据标准。
VIII. 协议和元数据标准化的考虑
虽然详细的协议和元数据标准尚待跨机构建立和商定,但鉴于光谱学在植物研究中应用的迅速增加,在此阶段提供一些指导非常重要。IHerbSpec已发布了一份用于测量和元数据标准化的协议。建议包括:对每份标本的叶片内和叶片间的变异进行充分采样;定期使用已知反射率的标定板进行测量;使用低反射率的黑色背景来最小化透射光污染;建立强大的元数据标准,记录组织、标本、仪器和项目特定字段;对原始光谱数据进行适当的处理(如重采样、降噪);以及确保性状预测模型适用于特定类别的标本。元数据管理和网络基础设施发展对于将植物标本光谱数据整合到全球生物多样性平台至关重要。
IX. 数据库充分性
网络基础设施的发展对于实现光谱数据的大规模聚合至关重要。虽然已经开发了几个专门用于光谱数据和模型的基础设施平台(如EcoSIS和EcoSML),但它们不足以捕获生物多样性收藏所需的分类学信息。更有效的解决方案是确保自然历史博物馆的数据库能够纳入光谱数据和关键的关联元数据。此外,实施能够处理高维数据集的分析引擎将是变革性的。扩展Darwin Core(DC)标准以纳入植物标本反射光谱学,将实现与现有生物多样性信息学平台的数据共享。
X. 有效、公平和符合伦理的采样
植物标本馆的用户和管理者必须在创新与保存之间取得平衡。光谱采样和测量策略的有效实施需要仔细考虑标本的特征以及世界各地植物标本馆采用的保存和修复方法。在理想条件下,光谱数字化提供了传统性状测量的无损替代方案,允许研究人员在不物理改变标本的情况下推断关键植物性状。当需要从标本中移除组织时,应绝对最小化,避免识别或未来使用的关键特征,并记录移除的内容。必须获得进行这些努力的许可。最后,促进合作至关重要,包括正式承认植物标本馆学者、工作人员和科学家为贡献者、合作者、资助伙伴和合著者。
XI. 下一步
国际植物标本光谱数字化(IHerbSpec)工作组已准备好进行下一代光谱数字化。我们承认,作为一个团体,我们还有大量工作要做,以确保数据能够被聚合,并确保公平和公正的做法。作为第一步,我们为团体制定了一份初步的协议和元数据标准。IHerbSpec欢迎新的合作者,因为我们努力规划光谱数字化的未来。我们承诺在我们的工作中保持协作、包容和公平,并利用世界植物标本馆的数据来增进对世界生物多样性的理解和保护。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号