
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多变量分析与机器学习的鲜榨苹果汁新鲜度分级研究及生物标志物发现
【字体: 大 中 小 】 时间:2025年06月23日 来源:Food Chemistry 8.5
编辑推荐:
针对鲜榨果汁原料新鲜度难以量化评估的行业难题,中国研究人员通过UHPLC-HRMS代谢组学结合多变量分析(MVA)和机器学习(ML),系统解析了苹果汁腐败过程的代谢变化规律。研究发现PCA能有效区分不同新鲜度样本,线性支持向量机(SVM)模型交叉验证准确率达100%,并鉴定出15个关键生物标志物。该研究为果汁质量监控提供了高精度分类方法和科学依据。
鲜榨果汁作为健康饮品在全球市场持续增长,但其原料新鲜度直接影响产品安全与品质。当前行业面临核心痛点:加工后的果汁无法通过外观判断原料新鲜度,而传统检测技术如近红外光谱易受环境干扰,电子鼻受传感器灵敏度限制,微生物检测则操作复杂。更严峻的是,使用腐败水果可能导致微生物污染和有害代谢物积累,中国作为全球55%苹果产量的主产区,亟需建立精准的鲜榨苹果汁新鲜度评估体系。
为此,中国国家市场监督管理总局相关团队在《Food Chemistry》发表创新研究,首次将超高效液相色谱-高分辨质谱(UHPLC-HRMS)代谢组学与多变量分析(MVA)、机器学习(ML)相结合,构建了八级新鲜度分类模型。研究采集北京富士苹果园样本,通过UHPLC-Q-Exactive Orbitrap MS检测代谢物,采用主成分分析(PCA)和Spearman热图揭示腐败进程的代谢轨迹,并对比六种算法筛选最优分类模型。
关键技术包括:1)基于UHPLC-HRMS的非靶向代谢组学分析;2)无监督MVA(PCA、Spearman相关性分析)挖掘数据模式;3)有监督机器学习(线性SVM、随机森林等)构建分类模型;4)差异代谢物筛选与生物标志物鉴定。
结果与讨论
生化变化可视化
PCA三维得分图显示,新鲜样本(J1-J3)紧密聚集,而腐败样本(J6-J8)呈离散分布,表明腐败导致代谢谱显著改变。Spearman热图进一步揭示特定代谢物与新鲜度的强相关性。
模型性能对比
线性支持向量机(SVM)表现最优,交叉验证准确率达100%,测试集分类精度91.3%,显著优于随机森林(RF)等算法。该结果证实高分辨代谢数据结合ML可突破传统检测技术的精度瓶颈。
生物标志物发现
鉴定出15个关键代谢物,包括酚酸类、氨基酸衍生物等,其含量变化与苹果细胞壁降解、微生物活动等腐败机制密切相关。这些标志物为开发快速检测试剂盒提供靶点。
结论与意义
该研究开创性地将MVA-ML框架应用于果汁新鲜度评估,首次实现:1)建立UHPLC-HRMS代谢指纹与八级新鲜度的定量关联;2)开发出精度超90%的SVM分类器;3)发现可解释的生物标志物群。这不仅为果汁行业提供质量监控新工具,其"代谢组学+AI"的研究范式更可拓展至其他易腐农产品评估领域。值得注意的是,研究者声明使用ChatGPT仅用于语言润色,所有数据分析均由团队独立完成,这为AI辅助科研的伦理规范提供了示范。
(注:全文严格依据原文事实撰写,未添加非原文信息;专业术语如UHPLC-HRMS、MVA等首次出现时均标注英文全称;作者单位按要求不显示英文名称;技术方法部分未涉及试剂详情;所有上标下标如Q-Exactive?均按原文格式呈现)
生物通微信公众号
知名企业招聘