基于机制进化模型解析基因组对局域气候适应的分子特征

【字体: 时间:2025年08月28日 来源:Methods in Ecology and Evolution 6.2

编辑推荐:

  这篇研究通过构建分层贝叶斯模型(hierarchical Bayesian model),创新性地整合了RAD-seq数据不确定性量化与进化过程机制建模,解决了传统环境关联分析(GEA)中观测误差忽略和现象学模型局限两大痛点。研究以柳蝇霸鹟(Willow Flycatcher)105k SNPs数据为案例,鉴定出47个与温度季节性(BIO4)显著关联的位点,发现EDIL3、PCDH1等30个基因在卵矿化、羽毛发育和耐极端温度中的关键作用,为气候变化下物种适应性进化研究提供了新范式。

  

1 引言

随着全球气温上升,物种面临灭绝风险加剧的严峻挑战。柳蝇霸鹟(Empidonax traillii)作为北美迁徙鸣禽,其西南亚种(E. t. extimus)因栖息地丧失已被列为濒危物种。理解物种通过基因组适应性(genomic adaptation)应对气候变化的机制,对制定进化管理策略至关重要。传统环境关联分析(GEA)存在两大局限:一是忽略有限采样和基因型缺失导致的观测误差;二是依赖现象学模型(phenomenological models)区分适应性与非适应性变异。

本研究提出三层级贝叶斯框架:

  1. 1.

    数据模型:通过二项分布连接RAD-seq个体基因型与群体等位基因频率,量化测序深度不足(3%位点缺失)导致的估计不确定性;

  2. 2.

    过程模型:基于Wright岛模型(island-metapopulation model),用超几何合流函数描述选择系数(sl)与环境变量的线性关系(公式8),β分布刻画中性变异;

  3. 3.

    参数模型:采用正则化马蹄先验(horseshoe prior)压缩大部分位点的环境敏感性系数(βlj),契合分子进化理论中"多数变异中性"的预期。

2 数据与方法

研究分析了美国23个采样点175只柳蝇霸鹟的RAD-seq数据(约105k SNPs),选取4个低相关性气候变量:温度季节性(BIO4)、最热月最高温(BIO5)、最冷季均温(BIO11)和最干季降水(BIO17)。通过Stan语言实现哈密尔顿蒙特卡洛(HMC)算法,以-2lnP(βlj≠0)作为显著性阈值(图4)。

3 模型验证

通过模拟测试三类突变-迁移参数体系:

  • 低突变-中迁移:正确识别9/15适应性位点,但BIO4与BIO11因负相关(r=-0.72)导致2个位点误判;

  • 高突变-高迁移:中性过程主导,假阴性率升高;

  • 对比LFMM方法:假阳性率最高达38%(表S3-S6),凸显机制模型优势。

4 关键发现

在真实数据中鉴定出47个显著位点(46个关联BIO4),其中36个位于30个基因的25kb范围内:

  • 功能注释:EDIL3调控卵壳钙化(Le Roy et al. 2021)、PCDH1参与羽毛发育(Lin et al. 2013)、GRIK2作为冷感受器(Cai et al. 2024);

  • 基因簇现象:物理连锁位点成簇出现(图4b灰线),提示选择性清扫(selective sweep)导致的遗传搭车效应;

  • 计算效率:105k SNPs分析耗时32小时,运行时间随位点数(L)呈指数增长(图S6)。

5 应用拓展

模型灵活性支持多场景扩展:

  • 测序技术:可适配低深度全基因组测序(low-coverage WGS)和混池测序(pool-seq);

  • 动态过程:未来可整合空间显性模型(spatial dominance model)研究范围迁移;

  • 多组学整合:加入GWAS层解析多基因性状(polygenic traits)的非克隆模式。

这项研究为理解气候驱动的适应性进化提供了新工具,其分层建模框架将观测误差、进化机制和先验知识系统整合,在保护基因组学(conservation genomics)领域具有广泛适用性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号