
-
生物通官微
陪你抓住生命科技
跳动的脉搏
光谱技术结合机器学习突破杨属木材物种级快速无损鉴定的屏障
【字体: 大 中 小 】 时间:2025年06月20日 来源:Microchemical Journal 4.9
编辑推荐:
【编辑推荐】针对木材物种鉴定中化学组成相似性及环境干扰导致的精度瓶颈,中国林业科学研究院团队创新性地将衰减全反射傅里叶变换红外光谱(ATR-FTIR)与随机森林(Random Forest)、XGBoost算法结合,成功实现6种杨属(Populus)木材的物种级鉴别(准确率0.87-0.90),通过可解释性分析揭示关键光谱特征与化学成分的关联,为林业管理及濒危物种保护提供高效无损解决方案。
木材鉴定是林业资源管理、海关执法及濒危物种保护的核心环节,但传统解剖学方法依赖破坏性取样和专家经验,分子生物学技术则面临操作复杂、耗时长等局限。尤其对于化学组成相近的杨属(Populus)物种,其细微的木质素(lignin)和半纤维素(hemicellulose)差异更易被地理来源差异掩盖,导致光谱鉴定长期停滞在属级水平。中国林业科学研究院的Yupei Wei、Juan Guo等团队另辟蹊径,通过融合衰减全反射傅里叶变换红外光谱(ATR-FTIR)与机器学习算法,在《Microchemical Journal》发表研究,首次实现杨属6个物种的高精度无损鉴定。
研究团队从中国林科院木材标本馆(CAFw)精选62份涵盖11国的杨属标本,包括腺杨(P. adenopoda)、香杨(P. suaveolens)等6个物种。采用ATR-FTIR技术快速采集样本切向面光谱数据,经预处理和主成分分析(PCA)降维后,利用基于模型优化的随机森林和XGBoost算法构建分类模型。结果显示,两种模型物种鉴别准确率分别达0.90和0.87,多分类曲线下面积(AUC)均超过0.96。通过沙普利值(Shapley values)可解释性分析,团队锁定与物种特异性化学成分相关的关键主成分,如P. euphratica光谱中表征木质素甲氧基的特征峰,为化学差异驱动物种分化提供直接证据。
Wood collection
研究选取杨属6个分类组(section)的代表物种,确保样本覆盖不同地理分布和形态特征。Wood spectral dataset 部分通过多国样本采集(如P. nigra来自7国)和重复测量(每标本20条光谱),有效捕获环境变异引入的噪声。Conclusion 强调该方法突破传统光谱技术对物种级鉴定的分辨率限制,其非破坏性特点特别适合珍贵木材和考古样本分析。
该研究的创新性体现在三方面:首次将可解释性机器学习应用于木材FTIR数据解析;建立首个跨多国样本的杨属光谱数据库;为其他近缘树种鉴定提供方法论模板。正如通讯作者Yafang Yin和Tuo He所述,该技术未来可扩展至濒危树种监管和非法木材贸易追溯,推动森林可持续管理进入智能化时代。
生物通微信公众号
知名企业招聘