通过研究不同品种重猪的血浆代谢组,鉴定与饲料效率和生长率相关的生物标志物
《animal》:Identification of biomarkers for feed efficiency and growth rate by exploring the plasma metabolome of divergent heavy pigs
【字体:
大
中
小
】
时间:2025年11月21日
来源:animal 4.2
编辑推荐:
饲料转化率与平均日增重代谢组学差异及生物标志物筛选研究。通过无目标代谢组学分析意大利Large White重型猪血浆代谢物,Boruta算法筛选出11个FCR差异代谢物(如O-脂酰肉碱)和8个ADG差异代谢物(如6β-羟olithocholate),发现FCR代谢特征与ADG存在独立生物学机制。代谢网络分析显示脂肪酸氧化(肉碱类)、胶原蛋白代谢(羟脯氨酸)及肠道微生物活性(苯乙酸甘氨酸)为关键通路。研究证实FCR与ADG虽负相关但遗传独立,为精准选育提供新生物标志物。
猪养殖业中,饲料成本是最大的支出之一,对生产系统的可持续性产生显著影响。因此,提高饲料利用效率是减少这些成本和环境影响的关键策略。特别是在意大利大型白猪的重型养殖系统中,这些猪在达到更高的活体重量后才被屠宰,以符合受保护的原产地命名(PDO)干腌火腿价值链的要求。由于生长速度与饲料利用效率密切相关,而PDO规则规定猪不能在设定的年龄限制前达到屠宰重量,因此需要控制猪的每日增重。本研究利用非靶向代谢组学方法,分析了意大利大型白猪的血浆代谢物,以识别那些能够区分饲料利用效率和生长速度不同的个体,并可能成为这两个性状的生物标志物。
研究从672头经过性能测试的猪中选取了两个部分重叠的数据集,每个数据集包含200头猪,分别代表饲料转化率(FCR)和平均日增重(ADG)的极端和不同的性状。对这些猪的血浆进行了约700种代谢物的分析。代谢组学数据使用Boruta机器学习算法进行分析,以识别区分极端FCR和ADG的代谢物。这些代谢物进一步通过单变量和多变量分析进行评估。Boruta算法在FCR数据集中识别出10种代谢物,在ADG数据集中识别出7种代谢物,其中还有一种代谢物在两个数据集中都有出现。大多数在FCR数据集中选择的代谢物仍然显示出显著的区分能力,即使它们没有在Boruta分析中被选中,但它们在曲线下面积(AUC)指标上显示出中等到高的值,并且在曼-惠特尼检验(MWU)中表现出高度显著的P值,而情况则相反。研究中检测到的代谢物中,L-肉碱和O-己二酰基肉碱,这两种都参与脂肪酸代谢的代谢物,在饲料转化率高的猪中浓度显著升高。异亮氨酰羟脯氨酸和脯氨酰羟脯氨酸,与胶原蛋白周转有关,在饲料转化率低的猪中浓度较高,这可能反映了更高效的蛋白质代谢。其他与肠道微生物群活动相关的代谢物也显著区分了高和低饲料转化率及平均日增重的猪,表明微生物群可能在营养物质利用中起着重要作用。研究确认了饲料利用效率和生长速度是相关但不同的性状,其独立考虑将有助于提高生物标志物发现和遗传选择的准确性。
提高饲料利用效率对于猪养殖的经济和环境可持续性至关重要。生长速度,作为饲料利用效率的一个相关性状,在重型猪生产系统中需要加以平衡。本研究通过非靶向代谢组学方法,在意大利大型白猪中识别出与饲料利用效率和生长速度相关的血浆代谢物。研究目标是通过比较高和低饲料转化率以及高和低平均日增重猪的代谢物丰度,描述代谢途径和可能的生物标志物,以增强对猪饲料利用效率和生长过程的生物学理解。
研究中的动物和血液样本均遵循意大利和欧洲相关法规进行管理,所有程序也符合动物护理和屠宰的法规。研究人员没有对活体动物进行实验处理,而是通过商业屠宰场进行采样,遵循标准操作程序。动物在屠宰前并未进行专门的禁食处理,而是按照常规的屠宰前处理流程进行。所有样本均在屠宰后从动物中收集,并通过标准流程分离血浆,随后进行存储。研究中使用了R v.4.2.3和Python v3.11.7进行数据处理和分析。
为了识别区分极端组的代谢物,研究使用了Boruta机器学习算法进行特征选择。Boruta是一种全相关特征选择方法,基于随机森林分类算法,已被证明在非靶向代谢组学分析中比其他算法更具鲁棒性和稳定性。Boruta算法通过一系列随机森林模型来评估每个代谢物的区分能力,创建“阴影”代谢物作为原始数据的随机复制,并比较原始数据与阴影数据的模型表现,以判断代谢物是否显著优于阴影代谢物。对于本研究,分析在Python v3.11.7中实施,使用了BORUTA_py和scikit_learn包。研究调整了默认参数,将最大迭代次数从100增加到1000,并将显著性阈值从0.05降低到更严格的0.01,以获得更稳健的统计结果。该特征选择过程应用于每个由缺失值插补和线性模型得到的25个数据集。每个特征选择运行五次,使用五种不同的随机种子,以考虑Boruta算法的随机性。最终,得到了250个交叉验证数据集,每个数据集包含9/10的原始数据。研究将代谢物分为三个类别:1)稳健代谢物:在125次Boruta运行中均被标记为“确认”,并在10次交叉验证中至少有1000次运行中被标记为“确认”;2)一致代谢物:在所有125次特征选择运行中均被标记为“确认”,不考虑交叉验证;3)宽松代谢物:在至少100次特征选择运行中被标记为“确认”,不考虑交叉验证。
为了评估所选代谢物的区分能力,进行了额外的单变量和多变量分析。这些分析分别在每个数据集中进行,并随后应用于另一个数据集进行交叉测试。具体来说,FCR数据集中的代谢物被应用于ADG数据集进行分析,反之亦然。单变量分析包括相对浓度百分比差异(Δ%)、曼-惠特尼U检验(MWU)和曲线下面积(AUC)。Δ%用于计算代谢物浓度的相对差异,而MWU检验用于评估统计显著性。AUC则用于总结接收者操作特征(ROC)曲线,以评估二元分类模型在不同分类阈值下的性能。较高的AUC值表示更好的分类性能。这些分析使用了Python v3.11.7中的相关函数进行。
多变量分析包括主成分分析(PCA)和随机森林分析。PCA用于线性降维,减少数据集的维度,同时保留大部分原始信息。PCA有助于评估数据集的聚类和分离情况,无论是定性还是定量。随机森林分析使用了scikit_learn包中的RandomForestClassifier函数,每个代谢物集用作输入训练随机森林分类器。训练后的模型基于其袋外(OOB)得分和每个特征(即代谢物)在分类中的重要性进行评估,重要性通过平均杂质减少(Gini指数)来衡量。随机森林分类器使用了自助聚合(bootstrap aggregation)方法,其中每个树从观察样本的自助样本中拟合,剩余样本用于预测。袋外误差计算为训练过程中预测错误的平均值,袋外得分则为1-袋外误差。较高的袋外得分表示模型在训练过程中正确地将大部分袋外样本分配到极端组,表明基于所选代谢物集的分类效果良好。
为了进一步评估所选代谢物的功能联系,进行了代谢物网络构建和通路分析。网络基于所选代谢物(宽松组)通过计算斯皮尔曼相关系数(ρ)进行构建。在FCR数据集中,网络显示了代谢物之间的中等至高相关性。通路分析使用了MetaboAnalyst v6.0平台,输入了所选代谢物的Human Metabolome Database标识符。代谢物集从RaMP-DB数据库中获取,该数据库包含3694种代谢物和脂质通路。通路中包含至少两种代谢物,并且在FDR校正后的P值小于0.05的被认定为统计显著。
研究中识别的代谢物显示了显著的区分能力,其中FCR数据集中的11种代谢物在曼-惠特尼U检验中表现出高度显著的P值(P < 0.005)。大多数这些显著代谢物显示出负的Δ%值,表明在低饲料转化率组中浓度较低,范围从-14.98%(神经酰胺)到-54.71%(未命名代谢物)。相反,两种脂质(L-肉碱和O-己二酰基肉碱)和一种未命名代谢物显示出中等至较大的正Δ%值(从12.81%到37.85%)。AUC值进一步确认了代谢物的区分能力,范围从0.64到0.70,且没有在稳健、一致和宽松类别之间出现明显差异。
在ADG数据集中,八种代谢物被识别,其中三种属于稳健组,其余五种属于宽松或一致组。这些代谢物中,两种属于氨基酸,四种属于脂质,两种未命名。在交叉测试分析中,仅有一种代谢物(未命名代谢物X-17354)在ADG和FCR数据集中均显示出显著的区分能力。研究中,代谢物的Δ%值揭示了高和低ADG组之间的不同变化模式。例如,N6-甲基赖氨酸和X-12216在低ADG组中浓度较高,而三甲胺N-氧化物、2-羟基癸酸和1-油酰基-GPE(18:1)在高ADG组中浓度较高。AUC值显示了ADG代谢物的区分能力,范围从0.59到0.68。
研究中通过构建代谢物网络和通路分析,揭示了代谢物之间的功能联系。在FCR数据集中,七种代谢物形成了三个聚类,其中两种代谢物(异亮氨酰羟脯氨酸和脯氨酰羟脯氨酸)显示出高度相关性(ρ = 0.94),在低饲料转化率组中浓度较高,而在ADG数据集中则未显示显著差异。这些二肽与胶原蛋白或胶原样蛋白的分解有关,可能反映了胶原蛋白周转和重塑的增加,这可能有助于组织维护和修复,而不会造成过高的代谢成本。
另一组相关代谢物包括对-甲酚葡萄糖苷(一种肽)、苯乙酰基甘氨酸(一种氨基酸)和一种未分类代谢物(X-16580)。虽然苯乙酰基甘氨酸和对-甲酚葡萄糖苷在低饲料转化率组中浓度较高,而未分类代谢物则显示出相反的趋势。这些代谢物可能与肠道微生物群的活动有关,而进一步的分析将有助于明确其具体作用。
研究中识别的代谢物在PCA和随机森林分析中均显示出较高的预测性能,特别是在其各自的数据集中。这表明这些代谢物在区分高和低饲料转化率或平均日增重猪方面具有重要价值。然而,研究也指出,这些复杂的性状是多基因和多因素的,因此未来的研究应整合代谢组学与其他组学层(如基因组学、转录组学、蛋白质组学和微生物组学),以提供更深入的机制理解并验证生物标志物在更广泛的表型范围内的有效性。此外,未来的研究还应包括在整个生长阶段被监测的猪和代表中间表型的群体,以完善这些性状的代谢图谱。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号