
-
生物通官微
陪你抓住生命科技
跳动的脉搏
NIRDiffusion:基于扩散模型的工业植物材料近红外光谱质量评估新框架
【字体: 大 中 小 】 时间:2025年05月30日 来源:Industrial Crops and Products 5.6
编辑推荐:
为解决工业植物材料中水溶性蛋白(WSP)和人参皂苷(TG)快速精准检测的难题,研究人员开发了基于扩散模型的NIRDiffusion框架,结合1D-CNN回归模型,实现了大豆种子WSP(R2=0.973)和西洋参TG(R2=0.949)的高精度预测,较传统方法误差降低17.89%以上。该研究为植物源性材料的无损检测提供了创新解决方案,推动了人工智能与近红外光谱技术在工业质量控制中的深度融合。
在生物基材料和制药原料生产中,大豆和西洋参等工业植物材料的质量控制至关重要。传统检测方法如化学滴定和高效液相色谱(HPLC)虽准确但耗时耗力,而近红外(NIR)光谱技术虽快速无损,却受高维数据、环境噪声和小样本限制。现有特征提取方法如主成分分析(PCA)和自编码器(AE)难以捕捉非线性特征,自监督学习方法如掩码自编码器(MAE)对概率分布建模不足。这些瓶颈严重制约了NIR技术在工业场景中的应用。
针对这一挑战,中国的研究团队在《Industrial Crops and Products》发表研究,提出NIRDiffusion框架。该研究采用扩散模型(Diffusion Model)的迭代扰动-去噪机制,通过1D-UNet提取多尺度潜在特征,结合1D-CNN回归模型,构建了端到端的质量评估系统。实验使用1835份大豆种子和1785份西洋参样本,覆盖中国哈尔滨、加拿大蒙特利尔等多产地来源,通过标准正态变量(SNV)预处理和Kennard-Stone样本划分,采用十倍增强训练策略提升模型鲁棒性。
研究结果显示,在特征有效性方面,NIRDiffusion提取的特征与目标成分的相关系数较AE/MAE提升0.05-0.12。模型性能上,对大豆WSP的预测R2达0.973(RMSE=0.312%),西洋参TG预测R2达0.949(RMSE=3.135%),较PCA误差降低17.89%(WSP)和11.21%(TG)。Bland-Altman分析证实其预测偏差范围显著窄于传统方法。扩散过程分析表明,在时间步t=5时重建的光谱曲线能最佳保留有效特征,此时特征维度压缩至原始数据的1/16。
该研究的创新性体现在三方面:首先,将扩散模型的概率生成能力引入NIR分析,通过前向加噪-反向去噪的迭代过程有效分离噪声与信号;其次,设计多尺度特征融合机制,整合d/4、d/8、d/16三个尺度的光谱特征;最后,构建轻量级1D-CNN预测模块,参数数量仅为传统CNN的1/3。在讨论部分,作者指出该方法在异质性样本(如不同产地的西洋参)中表现优异,RPD值均超过4.0,证明其强大的泛化能力。
这项研究为工业植物材料的智能检测提供了新范式,其技术路线可扩展至其他生物活性成分分析。未来工作将聚焦于模型压缩以适应便携式NIR设备,并探索跨物种迁移学习策略。该成果对实现制药和食品工业的实时质量监控具有重要实践价值,标志着人工智能与光谱分析技术的融合进入新阶段。
生物通微信公众号
知名企业招聘