基于可解释单个人工神经元的营养素响应建模新方法及其在精准营养中的应用
《Scientific Reports》:Nutrient–response modeling with a single and interpretable artificial neuron
【字体:
大
中
小
】
时间:2025年11月25日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对传统非线性回归模型在营养素响应曲线拟合中灵活性不足,而复杂机器学习方法又缺乏可解释性的问题,开发了一种基于单个人工神经元(使用tanh激活函数)的可解释机器学习框架。该研究整合了数据增强、贝叶斯正则化和Bootstrap重采样等现代ML技术,在12个家禽和鱼类营养素响应数据集上验证了其性能。结果表明,该方法在保持高解释性的同时,其拟合优度(R2平均0.89)与传统模型相当甚至更优,并能稳健地估计Req95%等关键营养指标及其置信区间。研究成果以用户友好的图形界面软件NutriCurvist形式发布,为精准营养提供了新的可靠工具。
在动物营养学研究中,准确描述营养素摄入与生理响应之间的关系至关重要,这直接关系到饲料配方的优化、动物生产性能的提升以及资源的有效利用。数十年来,研究人员主要依赖经典的非线性回归模型,如四参数逻辑斯蒂模型、指数模型等,来拟合这些营养素响应(Nutrient-Response, N-R)曲线。这些模型虽然具有参数可解释的优点,但其结构相对固定,在面对小型、有噪声的实验数据时,往往显得灵活性不足,估计结果可能不稳定。
与此同时,机器学习(Machine Learning, ML),特别是人工神经网络(Artificial Neural Networks, ANN),在处理复杂非线性关系方面展现出强大能力。然而,其通常被视为“黑箱”,模型内部机制难以理解,这使得注重生物学解释的营养学家们对其望而却步。如何在模型的灵活性与可解释性之间找到平衡点,成为推动数据驱动精准营养发展的一个关键挑战。
在此背景下,来自霍恩海姆大学(University of Hohenheim)的Hamed Ahmadi和Markus Rodehutscord在《Scientific Reports》上发表了一项研究,提出了一种新颖的解决方案:使用一个单一的、可解释的人工神经元来建模营养素响应曲线。这项研究巧妙地桥接了经典回归模型的透明性和现代机器学习的灵活性,旨在为营养科学提供一种既强大又易于理解的工具。
为了验证所提出的方法,研究人员收集了12个独立的营养素响应数据集,这些数据集来源广泛,涵盖了鸡(肉鸡、蛋鸡)、北京鸭、日本鹌鹑和虹鳟鱼等多种动物,涉及赖氨酸、蛋氨酸、缬氨酸、苏氨酸和磷等多种营养素,响应变量包括体重增加、饲料效率、蛋白质/赖氨酸/磷沉积、能量沉积和产蛋量等。研究采用的核心技术方法包括:1)构建基于双曲正切(tanh)激活函数的单个人工神经元模型;2)通过添加比例高斯噪声进行可控数据增强,以模拟生物变异性并提高模型在小数据集上的鲁棒性;3)采用贝叶斯正则化算法训练网络,防止过拟合;4)利用非参数Bootstrap重采样生成模型参数及衍生营养指标的置信区间,进行不确定性量化。
研究结果显示,单个人工神经元模型在所有12个数据集上均提供了稳健且稳定的拟合。其拟合优度指标(R2 平均为0.89,范围0.63-0.97;RMSE平均为11.40,范围0.06-46.9)与原始研究中使用的参考回归模型(R2 平均0.88,RMSE平均17.14)相当或更优。这表明该模型在准确性和可解释性之间取得了良好平衡,为后续营养指标的推导奠定了可靠基础。
从拟合的模型参数中,可以直接解析推导出具有明确生物学意义的营养指标,如最大响应变化率(rmax)、拐点营养素水平(Nutrient)、拐点响应值(Response)、滞后期(NutrientLag)、半衰期(Half-life)、渐近响应(Response∞)以及达到95%和99%渐近响应所需的营养素量(Req95%和Req99%)。这些指标清晰地展示了所有数据集中存在的S形、单调且收益递减的响应行为。导数曲线始终为正值但逐渐趋近于零,反映了边际利用效率随营养素供应增加而递减的规律。推导出的Req95%值与原始模型报告的值高度一致,多数差异在±5%以内。
对于包含非营养素因子(如物种、日粮处理、年龄)的数据集,研究通过增强箱线图(结合中位数置信区间凹口和Bootstrap均值置信区间)以及基于Bootstrap分布的方差分析(ANOVA)和Tukey HSD事后检验,进行了统计比较。
例如,在比较肉鸡和蛋鸡品系对赖氨酸响应(数据集1-6)时,发现绝大多数参数和衍生营养指标(约93%)存在显著差异,肉鸡表现出更高的生长潜力和赖氨酸需求。在数据集7中,比较了低蛋白(LP)和正常蛋白(NP)日粮下肉鸡蛋白质沉积对蛋氨酸的响应,发现LP日粮能在较低蛋氨酸水平下达到更高的蛋白质沉积峰值,而NP日粮则需要更高的蛋氨酸水平才能达到95%和99%的沉积量。这种基于统计结果的比较分析,有助于深入理解不同物种、基因型或饲养条件下营养需求的差异。
该研究成功地将可解释性、灵活性和准确性整合到一个简约的建模框架中。单神经元模型在数学上类似于四参数S形函数,但其参数定义和拟合过程更具灵活性,并且通过集成ML最佳实践(数据增强、正则化、Bootstrap),显著提升了在小数据集上的鲁棒性和不确定性量化能力。与经典回归模型相比,该框架不仅能提供可比的拟合优度,还能自动导出边际效率曲线等更多信息,且无需依赖用户手动设置参数初始值,降低了应用门槛。
研究的另一个重要贡献是开发了名为NutriCurvist的图形用户界面(GUI)软件,使不具备编程背景的营养学家也能轻松应用此方法。
该软件遵循FAIR(可发现、可获取、可互操作、可重用)原则,促进了方法的广泛传播和应用。
当然,该研究也存在一些局限性,例如当前模型假设响应是单调S形的,无法处理营养素过量可能产生的毒性效应等非单调反应。此外,模型目前仅处理单一营养素,未来可扩展至多维营养素互作研究。
总之,这项研究证实了基于单个人工神经元的可解释ML框架是营养素响应建模的有效工具。它通过简约而透明的模型结构,结合现代ML技术,实现了对关键营养指标的稳健估计和统计比较,为推进精准动物营养提供了新的方法论支持和实用的软件工具,有望在营养研究和实践中发挥重要作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号