虹鳟鱼应激分子特征与机器学习驱动的生物标志物:水产养殖与气候适应新策略
《Scientific Reports》:Molecular signatures and machine learning driven stress biomarkers for rainbow trout aquaculture and climate adaptation
【字体:
大
中
小
】
时间:2025年12月21日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对气候变化下鱼类应激管理难题,通过转录组学分析虹鳟鱼(Oncorhynchus mykiss)对高温、低温、拥挤、盐度和低水质五种环境胁迫的响应,鉴定出21,580个差异表达转录本(DETs)。研究发现,热应激诱导的转录组变化最为显著,且不同胁迫的分子特征具有高度特异性。利用机器学习模型,研究人员筛选出hsp47和hspa4l作为核心热应激生物标志物,其预测准确率高达98.61%。该研究为开发精准的鱼类健康监测工具和抗逆育种提供了关键分子靶点。
随着全球气候变暖,水温升高、水质恶化等环境胁迫正严重威胁着水生生物的生存与健康。在集约化水产养殖中,鱼类不仅要应对自然环境的挑战,还要承受高密度养殖、运输等管理操作带来的应激。这些应激不仅影响鱼类的生长和福利,还会导致免疫力下降,增加疾病爆发的风险。因此,如何快速、准确地评估鱼类的应激状态,并筛选出具有抗逆能力的个体,已成为水产养殖业可持续发展的关键。
传统的应激评估方法,如测量血液中的皮质醇水平,存在波动大、易受慢性应激影响等局限性。近年来,转录组学(Transcriptomics)技术,特别是RNA测序(RNA-seq),为深入理解生物体对环境的复杂分子响应提供了强大工具。然而,RNA-seq会产生海量的基因表达数据,如何从这些“大数据”中筛选出真正具有预测价值的生物标志物(Biomarker),并验证其在不同种群中的普适性,是当前面临的主要挑战。
为了攻克这一难题,来自美国马里兰大学的研究团队在《Scientific Reports》上发表了一项开创性研究。他们巧妙地将转录组学与机器学习(Machine Learning)相结合,系统分析了虹鳟鱼(Oncorhynchus mykiss)对多种环境胁迫的分子响应,并成功鉴定出一组能够精准预测热应激状态的生物标志物。
- 1.多胁迫转录组学分析:研究团队利用已发表的公共数据,分析了美国国家冷水鱼养殖中心(NCCCWA)虹鳟鱼种群在短期暴露于高温(25°C)、低温(2°C)、高盐度(32‰)、低水质(低溶解氧、高CO2)和拥挤五种胁迫下的鳃组织RNA-seq数据,鉴定差异表达转录本(DETs)。
- 2.机器学习特征筛选与模型构建:研究人员应用信息增益属性评估(InfoGainAttributeEval)等算法,从海量转录本中筛选出最具预测价值的特征。随后,利用随机森林(Random Forest)、逻辑模型树(LMT)、J48决策树、多层感知器(Multilayer Perceptron)和顺序最小优化(SMO)等多种机器学习模型,对筛选出的特征进行训练和评估。
- 3.跨种群验证:为了验证所发现生物标志物的普适性,研究人员将基于NCCCWA种群数据训练的模型,应用于一个独立的公共数据集——来自沙漠和山地环境的红带鳟鱼(Redband trout)种群,该种群经历了长期(28天)的热应激处理。
研究人员首先分析了NCCCWA虹鳟鱼种群在五种胁迫下的转录组数据。结果发现,热应激诱导的转录组变化最为显著,产生了10,024个独特的差异表达转录本(DETs),而拥挤胁迫仅诱导了271个独特的DETs。韦恩图分析显示,仅有39个DETs在所有五种胁迫条件下均被共同调控,这表明鱼类对不同环境胁迫的分子响应机制具有高度的特异性。
面对海量的转录本数据,研究人员利用机器学习方法进行特征筛选。他们发现,通过信息增益属性评估(InfoGainAttributeEval)算法筛选出的特征,在区分胁迫状态方面表现出色。例如,在热应激条件下,利用该算法筛选出的特征训练的模型,其分类准确率显著高于仅基于传统差异表达分析筛选的基因。
3. 热应激特异性生物标志物在跨种群验证中表现优异
为了验证所发现生物标志物的普适性,研究人员将基于NCCCWA种群数据训练的模型,应用于一个独立的红带鳟鱼种群数据集。结果发现,利用所有胁迫共有的39个DETs构建的模型预测效果不佳,准确率仅为52.78%。然而,当模型聚焦于热应激特异性的DETs时,预测性能显著提升。特别是,当特征集缩减至仅包含50个热应激特异性DETs时,随机森林(Random Forest)模型的分类准确率达到了88.89%。
4. 鉴定出核心热应激生物标志物hsp47和hspa4l
研究人员进一步缩小特征集,最终鉴定出两个核心热应激生物标志物:热休克蛋白47(hsp47)和热休克70 kDa蛋白4L(hspa4l)。利用这两个基因的表达数据构建的机器学习模型,在跨种群验证中表现出极高的预测准确率。例如,随机森林模型在红带鳟鱼数据集上的分类准确率达到了98.61%,且在不同时间点(第1、3、7、28天)均保持了优异的性能,表明这两个基因是短期和长期热应激的可靠分子指标。
本研究通过整合转录组学与机器学习,系统揭示了虹鳟鱼对环境胁迫的分子响应特征,并成功鉴定出hsp47和hspa4l作为核心热应激生物标志物。这些发现具有重要的科学意义和应用价值:
- 1.揭示了应激响应的特异性:研究证实,鱼类对不同环境胁迫的分子响应机制具有高度特异性,这为开发针对特定胁迫的精准监测工具提供了理论基础。
- 2.提供了可靠的生物标志物:hsp47和hspa4l被证明是跨种群、跨时间点的可靠热应激生物标志物。它们可以通过qPCR等简便方法进行检测,为水产养殖中的鱼类健康监测提供了低成本、高效率的解决方案。
- 3.推动了精准育种:这些生物标志物可以作为分子标记,用于筛选具有更高热耐受性的虹鳟鱼个体,从而加速抗逆品种的选育进程,帮助水产养殖业应对气候变化带来的挑战。
总之,这项研究不仅深化了我们对鱼类应激生物学机制的理解,也为实现水产养殖的精准管理和可持续发展提供了有力的技术支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号