
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于可复用CNN-LSTM模块的近红外光谱分析技术提升黄连中Berberine含量检测精度
【字体: 大 中 小 】 时间:2025年08月17日 来源:Microchemical Journal 5.1
编辑推荐:
本文提出了一种可复用的CNN-LSTM融合模块,通过结合卷积神经网络(CNN)和长短期记忆网络(LSTM)的优势,显著提升了近红外光谱(NIR)对黄连中Berberine含量的定量分析精度。相比传统偏最小二乘回归(PLS)、单一CNN或顺序连接模型(CNN-LSTM-S/LSTM-CNN-S),该模型将均方根误差(RMSE)降至0.095%,Pearson相关系数(CC)提升至0.983(p<0.01),为中药质量控制提供了高效、非破坏性的检测新范式。
Highlight
本研究创新性地将卷积神经网络(CNN)与长短期记忆网络(LSTM)深度融合为可复用模块,通过层级式捕捉近红外光谱(NIR)的局部特征与序列依赖性,实现了黄连中Berberine含量的高精度预测。
样本收集与预处理
78份黄连样本采自中国重庆石柱县标准化种植基地,经乙醇提取后,采用高效液相色谱(HPLC)测定Berberine含量作为参考值,并采集900-1700 nm范围的近红外光谱数据,经多元散射校正(MSC)和Savitzky-Golay平滑预处理后构建数据集。
超参数优化结果分析
研究发现:卷积核尺寸过小会忽略光谱全局特征,而LSTM隐藏层维度不足将限制长程依赖建模能力。最优参数组合(卷积核=16,LSTM维度=64)使模型在验证集上RMSE降低21.7%,显著优于传统PLS(0.196%)和单模块CNN-LSTM-S(0.132%)。
结论
该可复用CNN-LSTM模块通过交替堆叠卷积层(局部特征提取)与LSTM层(序列建模),突破了传统化学计量学方法对线性关系的依赖,为复杂中药成分的快速分析提供了新工具。模型在测试集上RMSE达0.095%,CC值0.983,且通过Welch检验证实其优越性(p<0.01),有望应用于制药过程实时质控。
生物通微信公众号
知名企业招聘