
-
生物通官微
陪你抓住生命科技
跳动的脉搏
海龟支系单倍型解析参考基因组揭示超同线性基因组与进化分歧热点
【字体: 大 中 小 】 时间:2025年09月19日 来源:GigaScience 3.9
编辑推荐:
为解决海龟生物多样性保护与进化机制解析的迫切需求,研究人员完成了全部7种现存海龟物种的高质量染色体级别单倍型解析参考基因组。研究揭示了海龟支系超过60百万年演化过程中惊人的基因组同线性,发现了富含免疫应答基因、嗅觉受体(ORs)、锌指蛋白和G蛋白偶联受体(GPCRs)的遗传多样性热点区域,并重建了其种群历史动态。该研究为理解海龟的环境适应、感官进化和保护管理提供了宝贵的基因组资源。
在全球生物多样性快速丧失的背景下,开发有效策略来缓解这场危机并维护地球生态平衡变得尤为紧迫。基因组学作为理解生物多样性和支持其管理的最快速发展技术之一,近年来通过高质量基因组资源的进步,极大地增强了我们探索地球生物多样性遗传基础的能力。海龟作为自非鸟类恐龙时代就已存在的古老生物,在海洋和沿海环境中扮演着关键生态角色,但由于人类活动如直接捕捞、渔业兼捕、栖息地丧失和气候变化等威胁,全球海龟种群正面临严重危机。目前7种现存海龟物种中,3种被国际自然保护联盟(IUCN)列为"濒危"或"极危",3种列为"易危",另一种虽被IUCN列为"数据缺乏",但已被澳大利亚政府列为"易危"。
尽管保护努力已使许多海龟种群出现积极成果,但努力和成功并不普遍,一些种群仍在衰退。海龟物种分布全球,栖息地生态位多样性显著,从深冷水域 oceanic divers like D. coriacea 到分布范围受限的特有物种如 N. depressus 和 L. kempii。不同物种展示出不同的食性特化程度,从饮食特化种到泛化杂食种。这些特性的基因组基础尚不清楚,而获取高质量基因组资源将有助于更精细地研究海龟适应不同栖息地和变化条件的遗传驱动因素。
本研究在先前已发表的两种海龟参考基因组基础上,完成了剩余5种海龟物种的高质量基因组,提供了单倍型解析的染色体级别参考基因组和高质量基因注释。通过PacBio HiFi(高保真)和染色质构象捕获(Hi-C)测序技术,研究人员成功将染色体分相到父母本单倍型,首次建立了完整的海龟基因组目录,为理解海龟进化及其在龟鳖类中的演化背景提供了独特机会。
研究人员采用了多种关键技术方法开展本研究。对5种海龟物种(C. caretta, E. imbricata, L. olivacea, L. kempii, N. depressus)进行了PacBio HiFi测序(覆盖度35X-60X)和Hi-C测序(覆盖度47X-129X),其中3个物种还进行了光学图谱测序。基因组组装遵循脊椎动物基因组计划(VGP)的最佳实践,使用hifasm进行初步contig组装,利用光学图谱和Hi-C读数进行scaffolding,并通过手动校正完成染色体级别组装。基因注释结合了转录组数据、蛋白质序列、从头预测和同源性方法,使用EvidenceModeler整合多种证据生成最终基因模型。
研究组装的单倍型分离染色体级别组装体具有高度连续性,显著优于之前基于PacBio CLR数据的D. coriacea组装和基于ONT读数的C. caretta组装。新单倍型组装显示出卓越的碱基准确性,质量值(QV)范围在65.2到70.4之间。所有基因组都被scaffold成完整的染色体分子,99.1%到99.9%的组装序列被分配到28条染色体。组装的基因组还显示出高基因完整性,通过BUSCO评估检测到Sauropsida谱系的单拷贝直系同源基因在98.5%到99.5%之间。
通过转录组数据、C. mydas和D. coriacea的蛋白质序列、从C. mydas和Malaclemys terrapin的注释liftover以及从头基因预测的组合方法,研究人员为每个组装基因组创建了一组蛋白质编码基因预测。注释本身在通过BUSCO评估基于Sauropsida的单拷贝直系同源基因时高度完整,达到与之前RefSeq生成的注释相当的完整性水平。
基于直系同源基因及其在龟鳖类基因组中的位置识别,研究揭示了该支系内惊人的高同线性,跨越超过1亿年的进化历史,仅在基因组的独特序列区域识别出少量变异热点。特别是在海龟中,所有28条染色体都高度共线性和同线性,在染色体水平上展示了完全的一对一同线性,除了D. coriacea第14号染色体末端的一个区域,该区域在6种Cheloniidae海龟物种的第11号染色体中发现。
跨龟鳖类基因组(包括陆龟和淡水龟科)的分析发现,大染色体(>50 Mb长度)在所有龟类基因组中表现出高同线性,在小染色体(<50 Mb长度)中,只有海龟基因组的第21和26号染色体在其他龟类基因组中重排。在这些实例中,海龟基因组的第21和26号染色体在中国池龟(Mauremys reevesii)的基因组中分别位于第4号染色体的臂(与海龟基因组的第6号染色体同线性)和第2号染色体的中央区域,这种定位在所有其他龟鳖类基因组中都是保守的。
使用所有有注释可用的龟类物种的蛋白质编码序列进行系统发育分析,为Cryptodira亚目(包括大多数现存龟类和陆龟)内的进化关系和物种形成事件提供了见解。拓扑结构和分化时间支持了先前基于少量核标记或线粒体DNA的研究发现。全基因组分析表明,海龟支系与其他Durocryptodira物种的分化发生在1.04亿年前(mya),Dermochelyidae(包括D. coriacea)与Cheloniidae科的分化大约在75.4 mya。在Cheloniidae科内,C. mydas和N. depressus的分化发生在大约33.6 mya,而其他物种的分化在25.4 mya左右。L. kempii和L. olivacea是最近分化的谱系,大约在7.72 mya分裂,这个时期与重大环境变化如特提斯海的关闭和南部海洋的冷却相关,这可能破坏了基因流动并促进了这两种Lepidochelys物种的物种形成。
比较个体内遗传多样性(按染色体平均杂合度测量)揭示了测序个体中染色体间的一致变异,每个物种显示出不同的变异幅度。值得注意的是,具有高种内多样性的染色体也表现出更高的基因密度和增加的种间遗传距离。与海龟和其他具有小染色体的物种的发现一致,研究发现平均杂合度以及基因密度和种间遗传距离在小染色体(12-28)中高于大染色体(1-11)。特别是第13、14、20、23、24和28号染色体表现出更高的遗传多样性、种间分化和基因密度。
此外,增加的杂合度和种间遗传距离水平集中在特定的热点区域,而不是均匀分布在整个染色体上。因此,研究人员识别出位于第13、14和24号染色体的3个区域,这些区域在海龟中表现出杂合度和遗传距离的共同升高。
对这些热点中基因的功能注释发现,编码免疫应答、嗅觉受体(ORs)、锌指和G蛋白偶联受体(GPCRs)蛋白质的多拷贝基因家族富集。这包括第13号染色体中免疫相关基因、GPCRs、ORs和锌指基因的富集;第14号染色体中MHC基因、免疫相关基因、GPCRs、ORs和锌指基因的富集;以及第24号染色体中免疫相关基因和GPCRs的富集。嗅觉受体(以其在气味感知和化学线索检测中的作用而闻名)特别集中在第13号染色体的热点区域,而MHC基因集中在第14号染色体的识别热点内。
研究人员分析了每个物种基因组中长纯合片段(ROH)的比例(FROH),并按长度分类片段,以区分导致背景亲缘关系(短ROH)的古代人口事件和近期近亲繁殖(长ROH)。N. depressus个体具有最高的总FROH(0.227),主要由短(0.5-1 Mb)片段组成,但在较长类别(1-2和2-5 Mb)中有显著表现。这种分布表明其升高的纯合性是由古代人口过程和更近期的种群衰退共同造成的。相比之下,L. olivacea个体显示出最低的FROH(0.0149),主要由短ROH组成,表明历史上更大更稳定的种群。
使用成对序列马尔可夫 coalescent(PSMC)模型,研究人员重建了7种现存海龟物种的人口历史,揭示了大约1-9 mya开始的种群衰退的一致模式,可能由较冷的海水温度驱动。在中更新世过渡期间,大约50万至120万年前,种群衰退停止,除L. kempii外的所有物种开始经历同步的种群扩张,C. mydas、C. caretta和E. imbricata的增长特别明显,而L. kempii保持了相对稳定的种群规模。种群峰值发生在30万年前至末次间冰期(Eemian period, 13-11.5万年前)。这个增长期之后是所有物种的第二次种群衰退,开始于大约10万年前,直到最近约5万年前。
研究结论表明,海龟支系的染色体级别注释基因组揭示了这一缓慢进化动物群体中惊人的遗传同线性,同时也揭示了基因组中持续经历加速进化和分化的热点区域,这些区域可能在物种间形态和生态多样性中发挥重要作用。这些区域包含对免疫应答、感知和响应环境能力以及在波动环境条件下调节基因表达重要的基因。
研究发现所有7种现存海龟物种高质量基因组中的超同线性揭示了一种显著的染色体结构保守性,这可能解释了在海龟中观察到的古代和近期物种分化间的杂交现象。这种结构稳定性可能通过保留基因顺序和结构支持了古代杂交事件,促进了减数分裂中的染色体配对,减少了不相容性,并使 viable and fertile hybrids 的形成成为可能。
所有海龟高质量参考基因组的可获得性为探索其适应、免疫和感官进化的基本问题开辟了新途径。海龟表现出对海洋环境的显著适应,包括极端迁徙行为、盐水耐受、出生地归巢和温度依赖性性别决定,但这些特征的遗传基础仍然知之甚少。研究结果强调小染色体和大染色体中相对同线性降低的特定区域是整个海龟支系中基因密度和遗传变异富集的关键位点。这种模式也在鸟类和其他爬行动物中观察到,小染色体的高GC含量和高重组率可能在促进多样化中发挥重要作用。
突出的进化多样化热点包含多拷贝基因家族,如参与检测气味剂和适应栖息地化学复杂性的嗅觉受体,以及对疾病免疫应答核心的MHC基因。这些在分化热点中发现的多拷贝基因家族可能代表了维持对动态或破坏性选择压力响应灵活性的适应机制, potentially aiding immune variability, environmental sensing, and essential survival responses across the diverse habitats these turtles inhabit。
从保护角度来看,基因组资源提供了强大工具来帮助理解海龟种群生存力和对人为威胁的韧性。基因组多样性、近交水平、有效种群大小和人口历史是评估灭绝风险和适应潜力的关键指标。研究结果表明,N. depressus保持了长期低种群规模和遗传多样性,类似于D. coriacea观察到的人口轨迹,而不是近期衰退导致的急剧损失,这突显了区分历史人口模式与当代近交的必要性。
海龟物种的人口历史揭示了过去1000万年间有效种群大小扩张和收缩的 broadly similar trajectories,尽管Ne的幅度在物种间有所不同。这些独特模式可能反映了物种特异性生活史和变化环境(如海洋温度、海平面和连通性的波动)的交集。栖息在浅海沿海栖息地的物种,如N. depressus,可能特别受到动态沿海环境的影响。 specifically, the low and stable population size of N. depressus may reflect its restricted neritic distribution and tendency to disperse over smaller distances compared to other sea turtle species。
研究人员观察到种群扩张的强烈同步性,种群峰值在30万年前至Eemian期间(13-11.5万年前),尽管人口变化的幅度在谱系间有所不同。这些种群扩张最有可能帮助维持这些物种的遗传多样性。将这些比较扩展到包括来自额外种群的个体可能会进一步证实人口历史与生态因素(如栖息地特异性、摄食习惯、热偏好、发育和成年觅食阶段(海洋性与沿岸性)和环境条件)之间的联系。
高质量参考基因组是创建物种保护和管理基因组工具包的重要构建块。发现海龟间展示的全基因组同线性水平的一个令人兴奋的结果是,为一个物种确定的用于确定特征(如性别和适应特征)的遗传标记可能也直接适用于其他物种,而无需新一轮的研发。拥有所有海龟的完整、注释、染色体级别基因组意味着此类标记或遗传区域可以快速在物种间验证,并转化为实用的保护工具包。
研究人员相信这些参考基因组对于测量和预测气候变化对海龟的影响也很有价值。对于像爬行动物这样的变温动物,气候影响可能特别显著,因为它们对温度波动敏感。对于海龟,这些影响可能更大,因为它们具有温度依赖性性别决定,巢穴温度的变化可能破坏性别比例和繁殖成功。由于这些影响可能通过表观基因组最好地证明,获取完整、注释的参考基因组增加了基于测量DNA或染色质修饰水平的标记的预测能力。
研究结果强调了不同海龟物种如何响应古代气候变化,反映了一系列适应策略和独特的生物地理情景。理解物种如何历史上响应气候变化为了解它们对当前和未来人为干扰的潜在反应提供了见解,有助于为保护策略提供信息,并预测气候转变对海龟种群的长期影响。
生物通微信公众号
知名企业招聘