综述:通过糖化作用将糖与蛋白质共轭以降低食物致敏性:机制、应用、挑战与未来方向
【字体:
大
中
小
】
时间:2025年10月11日
来源:TRENDS IN FOOD SCIENCE & TECHNOLOGY 15.4
编辑推荐:
本综述系统探讨了机器学习(ML)与深度学习(DL)在风味预测中的前沿应用,涵盖传统算法(SVM、RF、KNN)与先进模型(CNN、RNN、GAN、LLM),重点分析分子表征(SMILES、SELFIES)、多组学数据整合及味觉受体机制,为食品、香料和制药行业的创新提供可扩展且可解释的预测方案。
风味预测——通过挥发性与非挥发性化合物计算评估物质的感官特征——在食品、饮料、香精和制药行业的创新中日益重要。传统方法如气相色谱-质谱联用(GC-MS)和感官评价虽仍有价值,但面临可扩展性、主观性和成本限制。味觉感知由受体-配体相互作用介导,从根本上塑造了风味的多感官体验。
本综述审视了应用于风味预测的多种机器学习(ML)与深度学习(DL)方法,在甜、苦、鲜味/浓厚味、辛辣感和多类别味觉预测任务中对其性能进行基准测试。涵盖传统ML算法(支持向量机SVM、随机森林RF、K近邻KNN)与先进DL模型(卷积神经网络CNN、循环神经网络RNN、生成对抗网络GAN、大语言模型LLM),并额外关注混合与集成策略。重点讨论分子表征(SMILES、SELFIES、分子指纹)、多组学数据(基因组学、蛋白质组学、代谢组学)的整合以全面理解风味形成及基因型-表型-风味关系,以及味觉受体信息对增强模型可解释性的关键作用。
Key Findings and Conclusions
模型性能因味觉模态而异:梯度提升和共识模型在甜味预测中表现卓越,SVM和WLN-GNN(图神经网络)适用于苦味,CNN+GNN混合模型擅于多类别分类。浓厚味(Kokumi)与鲜味(umami)受益于GNN嵌入、iUmami-SCM以及经过实验验证的基于Transformer的模型,而辛辣感预测——尽管研究较少——在集成方法和量子化学特征辅助下展现出潜力。当前挑战包括高质量数据集有限、对新分子欠拟合以及深度学习可解释性差距。SELFIES和受体-配体感知模型(如BitterX、BitterTranslate、KokumiPD)等进展通过确保结构有效性和增强机制洞察力来应对这些问题。
本综述指明了未来发展方向,包括可解释人工智能(XAI)、物联网(IoT)驱动的数据收集、多组学融合、SELFIES及混合建模——为下一代食品、香精和制药创新中的可扩展、可解释风味预测提供了路线图。
风味是一种涉及味觉、香气、触感和口感的复杂多感官体验。味觉由非挥发性化合物驱动,香气受挥发性物质影响,是生物评估食物的关键。 alongside触觉感受和心理因素,这些输入引导食物选择并影响消费者行为。味觉感知由五种主要模态——甜、酸、咸、苦、鲜——通过可溶性化学物质与舌上味觉受体的相互作用来检测。这些由味觉、嗅觉和三叉神经系统处理,产生对于饮食决策至关重要的细致风味体验。产品特性、消费者人口统计和环境背景也塑造风味感知。视觉吸引力、质地和香气等属性在接受度和市场表现中扮演关键角色。因此,理解风味对于食品、饮料和香精行业至关重要。
风味预测通过识别负责味觉和香气的化合物来估计物质的感官特征。历史上,采用气相色谱-质谱联用(GC-MS)和感官小组等方法。虽然可靠,但这些技术耗时、昂贵且易受人为偏见影响。计算方法——尤其是机器学习——的出现提供了高效、可扩展和客观的替代方案。机器学习(ML)擅长分析大型复杂数据集以识别连接化学特性与感官结果的模式。标准ML技术包括支持向量机(SVM)、随机森林(RF)和k近邻(KNN),它们从分子和感官数据预测风味。这些模型通常需要专家驱动的特征工程以从输入数据中提取有意义的属性。深度学习作为ML的一个子领域,进一步增强了预测能力。卷积神经网络(CNN)和循环神经网络(RNN)等模型可以从原始高维输入(如分子图或感官描述符)中自动提取特征。这些模型擅长捕捉化学结构与风味属性之间的非线性关系,并在风味预测任务中展现出强大性能。
化学信息学在风味活性化合物建模中扮演关键角色。它使用数值描述符量化分子特性,并应用分子指纹、定量构效关系(QSAR)和分子对接等技术预测感官性状。这些方法支持虚拟筛选和具有所需风味特性的化合物的合理设计。生物信息学通过分析生物数据——基因组学、蛋白质组学、代谢组学——来补充这一点,以揭示风味的分子基础。全基因组关联研究(GWAS)、基因表达谱和代谢通路分析等技术识别参与风味生物合成的基因和生物过程,助力农业和发酵应用。
尽管潜力巨大,计算方法面临若干挑战。预测准确性取决于训练数据的质量、规模和多样性。许多风味数据集有限或特定于领域,这限制了其泛化能力。此外,ML模型,尤其是深度学习架构,通常作为“黑箱”运行,对其决策过程提供很少透明度。这种可解释性的缺乏在模型解释至关重要的领域可能构成障碍。可解释人工智能(XAI)的进展旨在通过增强模型透明度和信任来缓解这一问题。另一个挑战在于风味本身固有的复杂性。它受分子组成、环境背景和人类感知的影响,使得难以完全计算捕获。有效建模需要通过将符号推理与神经网络相结合的混合方法整合化学、感官和生物等多种数据源。然而,计算风味预测前景广阔。在食品行业,它有助于产品开发、配方优化和增强产品感官吸引力。在香精设计中,它支持创建新香气和预测消费者偏好。在制药领域,它有助于开发改善患者依从性的可口配方,特别是对于儿科和老年人群。
风味感知是嗅觉(香气)、味觉(味道)、触觉感受和心理影响相互作用产生的多面体验。味觉由激活嗅觉受体的挥发性化合物和刺激味蕾的非挥发性物质驱动。五种基本味道(甜、酸、咸、苦、鲜)提供与营养和潜在威胁相关的基本信号。G蛋白偶联受体(GPCRs)如T1R和T2R家族介导甜、鲜、苦味的检测。
Non-Machine learning methods in flavor prediction and analysis
非机器学习方法,包括感官评价和分析技术如GC-MS、高效液相色谱(HPLC)和核磁共振(NMR),对于风味预测仍然至关重要。它们提供对人类感知的洞察,并能够精确分析风味化合物,支持质量控制和产品开发。
Machine learning methods in flavor prediction
先进算法和机器学习技术越来越多地用于通过整合感官、化学和消费者数据来预测风味特征。QSAR、分子对接和化学信息学等方法有助于阐明风味-受体相互作用,从而支持新风味的设计。同时,监督和无监督机器学习方法分析复杂数据集以评估风味感知和消费者接受度。
数据集对机器学习和深度学习模型的有效性至关重要,因为它们使算法能够学习模式、进行预测并泛化到实际应用。高质量、标注良好且具有代表性的数据集有助于确保模型的准确性、公平性和鲁棒性。在风味预测中,数据集通常按味觉模态(如甜、苦、鲜、浓厚味、辛辣感)分类,为模型提供所需的基础输入。
Current Machine Learning Systems for Flavor Prediction
当前用于风味预测的机器学习系统根据它们针对的特定味觉模态和采用的模型类型进行分类——无论是传统机器学习、深度学习(DL)还是自然语言处理(NLP)技术,包括大语言模型(LLM)。与数据集的组织方式类似,这些系统根据风味预测任务和底层建模方法进行分组。Sankey图突出了不同模型架构与风味模态之间的流动和连接。
General Trends in Flavor Prediction
风味预测的演变与计算能力、数据可用性和机器学习方法的进步并行。时间线图展示了这些发展,突出了从早期QSAR模型到最新深度学习和LLM的关键里程碑。1980年代和1990年代,初始努力受限于小数据集和基本QSAR方法。这些依赖于简单的分子描述符和传统算法。
Challenges and Future Directions in Computational Flavor Prediction
尽管机器学习和大型数据集驱动风味预测取得显著进展,但仍存在若干关键挑战。主要限制包括数据规模受限、模型选择次优、复杂特征工程、数据质量担忧、有限模型可解释性、高计算需求以及新兴伦理考量。解决这些障碍对于增强模型准确性、可靠性和实际效用至关重要。此外,分子表征、多组学整合和可解释AI(XAI)是未来有前景的方向。
风味预测已从传统感官小组和分析技术发展到由机器学习(ML)和深度学习(DL)驱动的复杂计算方法。本调查回顾了非计算方法——如感官评价、GC-MS和电子舌/鼻——以及涉及传统ML算法(如SVM、RF、kNN)和先进DL架构(如CNN、RNN、Transformer)的计算策略。性能因味觉模态和模型架构而异,集成方法和混合模型显示出希望。挑战包括数据限制、可解释性差距和计算需求。未来方向涉及XAI、IoT驱动的数据收集、多组学融合、SELFIES和混合建模,为下一代风味创新提供路线图。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号