
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于随机森林模型的LC-MS与NMR数据融合策略在大黄素肝毒性代谢组学研究中的应用
【字体: 大 中 小 】 时间:2025年06月06日 来源:Journal of Pharmaceutical and Biomedical Analysis 3.1
编辑推荐:
本研究针对大黄素肝毒性代谢组学中多组学数据分类效果不佳的问题,创新性地采用随机森林(RF)模型构建中层次数据融合(MLDF)策略,整合液相色谱-质谱(LC-MS)与核磁共振(NMR)数据。结果表明,RF-RF模型显著提升四组给药时长的分类效果,为深入解析大黄素肝毒性机制提供新方法。
研究背景与意义
代谢组学研究中,单一分析平台如液相色谱-质谱(LC-MS)和核磁共振(NMR)各有局限:LC-MS灵敏度高但结构解析困难,NMR结构鉴定准确却灵敏度不足。此前研究发现,大黄素给药不同时长(0天、1天、7天、14天)的肝代谢组数据分类效果不理想,亟需多平台数据整合策略提升分析深度。
研究团队与方法
国内研究人员首次将LC-MS与NMR数据融合技术应用于大黄素肝毒性研究。通过主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)及支持向量机(SVM)、k最近邻(kNN)、神经网络(NN)、决策树(DT)、随机森林(RF)等机器学习算法,构建低层次(LLDF)和中层次(MLDF)融合模型。实验采用小鼠肝组织样本,通过LC-MS获取总离子流色谱图,NMR采集1
H谱数据。
研究结果
单数据集与LLDF模型效果有限
PCA和PLS-DA分析显示,单一LC-MS或NMR数据集仅能区分0天与1天、7天与14天组,四组分类效果不佳(图1a)。LLDF模型因数据冗余和噪声干扰,分类性能未显著提升。
MLDF-RF模型表现最优
基于RF特征选择的中层次融合(RF-RF)模型显著改善分类效果,有效区分四组样本。该策略通过保留关键代谢物特征(如K2
HPO4
相关信号),降低数据维度并提升信噪比。
多算法性能对比
RF在非线性建模和特征重要性排序中表现突出,优于SVM、kNN等传统方法,证实其适用于复杂代谢组数据整合。
结论与意义
本研究首次实现LC-MS与NMR的MLDF策略在大黄素肝毒性研究中的应用,RF-RF模型为多组学数据融合提供新范式。成果发表于《Journal of Pharmaceutical and Biomedical Analysis》,不仅深化了对大黄素代谢扰动机制的理解,也为中药毒性代谢组学研究提供了方法学参考。作者Miaomiao Jiang、Biying Chen等强调,该技术可推广至其他天然产物毒性评估领域。
生物通微信公众号
知名企业招聘