深度学习驱动色谱指纹图谱的超微颗粒粉末自动识别系统开发与应用

《Journal of Pharmaceutical Analysis》:UGP system: A deep learning-driven platform for automated identification of ultrafine granular powders using chromatographic fingerprinting

【字体: 时间:2025年10月26日 来源:Journal of Pharmaceutical Analysis 8.9

编辑推荐:

  本研究针对超微颗粒粉末(UGP)因外观高度相似而难以视觉鉴别、传统色谱方法缺乏统一标准的技术瓶颈,开发了融合高效液相色谱(HPLC)指纹图谱与一维卷积神经网络(1D-CNN)的智能识别系统。通过构建涵盖53种UGP的标准化数据库,结合数据增强技术优化模型泛化能力,最终实现测试集97.62%准确率和商业化样本95.24%的识别精度。该研究为药食同源中药UGP的质量控制提供了自动化、高通量的解决方案,对制药和功能性食品行业的产品真实性保障具有重要实践意义。

  
在传统中药现代化进程中,超微颗粒粉末(Ultrafine Granular Powder, UGP)作为一种创新剂型,通过超微粉碎技术将药材粒径控制在D90 < 45μm,再聚合成30-100目颗粒,既保留了药材全部成分,又显著提高了活性成分的溶出率和生物利用度。目前全国已有139种UGP产品纳入医保编码标准,其中不乏山楂、黄芪等药食同源品种。然而,UGP的广泛应用面临严峻挑战:不同品种的粉末外观高度相似,肉眼无法区分;各地生产企业缺乏统一工艺标准,质量参差不齐;传统色谱鉴定方法因检测条件(如流动相、波长、色谱柱)差异巨大,难以实现跨品种高通量检测。这种标准化缺失不仅推高了质检成本,更制约了UGP行业的规范化发展。
为解决这一难题,南京中医药大学研究团队在《Journal of Pharmaceutical Analysis》发表最新研究,开发了一套集成了高效液相色谱(High Performance Liquid Chromatography, HPLC)指纹图谱与深度学习技术的UGP智能识别系统(UGP system)。该研究建立了目前最全面的UGP色谱指纹数据库,涵盖29科53种药材的530批次样本,并采用标准化60分钟六波长(210、230、254、280、327、380 nm)检测方案,确保色谱重现性(质控样本保留时间相对标准偏差<2%)。团队设计了三层一维卷积神经网络(1D-CNN)模型,通过噪声干扰、基线漂移、保留时间偏移(3.5-60分钟)等数据增强策略将数据集扩增6倍,显著提升模型泛化能力。
关键技术方法包括:采用Agilent 1260 Infinity II系统与Cortecs T3色谱柱进行标准化HPLC分析;利用netCDF4库处理色谱数据,构建时间轴对齐的指纹矩阵;通过高斯噪声注入、保留时间平移和信号强度缩放实现数据增强;对比线性判别分析(Linear Discriminant Analysis, LDA)、支持向量机(Support Vector Machine, SVM)等传统机器学习方法;基于PyTorch框架构建1D-CNN模型,并采用Flask开发Web应用平台。
3.1. 超微颗粒粉末鉴定数据库
研究构建了首个系统化UGP色谱指纹数据库,包含42个品种(不少于10批次)的530批次样本,覆盖22种药食同源药材。该数据库的广度和批次数量为UGP质量评价奠定了坚实基础。
3.2. 1D-CNN与传统机器学习方法的比较分析
通过主成分分析(Principal Component Analysis, PCA)和t-分布随机邻域嵌入(t-SNE)可视化显示,传统方法难以完全区分UGP类别。性能测试中,1D-CNN在测试集达到97.62%准确率,显著优于SVM(92.50%)和LDA(97.50%),凸显其捕捉色谱峰形态细微差异的优势。
3.3. 1D-CNN模型参数优化
系统优化发现:学习率1×10-4可避免过拟合;100训练轮次保证模型稳定;三层卷积结构(滤波器数32/64/128)具有最佳特征提取能力;卷积核尺寸5与池化核尺寸2的组合最适配色谱数据特性。数据增强使模型损失值从0.1%降至0.006%。
3.4. 性能评估:准确性评估与比较
模型十次独立训练平均准确率达97.2%±0.65%,测试集精确度97.97%,召回率97.16%。对63个商业样本的外部验证准确率为95.24%。混淆矩阵分析显示,仅少数化学成分类似品种(如陈皮与枳实)存在误判,印证模型可靠性。
3.5. UGP系统集成与性能评估
基于Flask的Web系统实现数据上传、合并、转置和物种预测全流程自动化。交互界面集成图谱可视化、药材百科和案例库功能,支持多语言切换与日志管理,为无专业背景用户提供便捷操作体验。
该研究通过构建标准化色谱数据库与优化深度学习模型,成功解决了UGP多品种快速鉴定的技术难题。1D-CNN模型对完整色谱指纹(3.5-60分钟)的分析能力,避免了传统方法依赖人工特征选择的局限性。系统在商业样本中保持95.24%的识别精度,验证了其实际应用价值,为UGP行业提供了首个集数据管理、智能分析与结果解读于一体的自动化平台。未来通过扩展数据库规模、引入图神经网络(Graph Neural Network, GNN)等先进架构,可进一步强化系统在复杂场景下的适应能力,推动中药粉末制剂质量控制的智能化进程。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号