《Journal of Genetics and Genomics》:High-quality genome assembly of
Carex capillifolia reveals genetic adaptations to drought stress in the Qinghai-Xizang Plateau
编辑推荐:
Carex capillifolia染色体规模基因组组装揭示其耐旱基因及染色体演化机制,通过比较基因组学发现与近缘种26次染色体融合事件,结合基因组环境关联分析鉴定出ARF基因调控干旱耐受,并确认Ruoergai地理群具有最高气候适应潜力。
熊艳丽|于晴晴|熊毅|尤明红|何莉|吴国超|彭静涵|严丽军|邓东洲|马晓|陈德超|李大旭|熊雷
四川省草原科学研究院,成都,四川611700,中国
摘要
Carex capillifolia是一种生态和经济上都非常重要的饲料草,广泛分布于北半球,尤其是在青藏高原地区。关于其遗传多样性和基因组结构的研究一直较为有限。在这项研究中,我们完成了C. capillifolia的高质量基因组组装,基因组大小为386.65 Mb(contig N50 = 14.66 Mb),包含29条染色体。系统发育分析显示它与C. littledalei有密切的进化关系,两者之间的分化时间估计在219万至610万年前。比较基因组学分析发现了这两种物种之间共有的26次染色体融合事件,这表明了莎草科(Cyperaceae)内部显著的核型重组现象。通过群体基因组学、基因组-环境关联(GEA)和转录组分析,我们鉴定出多个与气候相关的遗传变异和耐旱基因。值得注意的是,我们发现了一个生长素响应因子(ARF)基因,并通过转基因实验验证了其在提高耐旱性方面的作用。此外,我们还确定了Ruoergai(RRG)地理群体对未来气候具有最高的适应性,该群体拥有优越的适应性遗传变异和可用于相关物种育种的候选基因。
引言
全球温度和降水模式及其对全球生物多样性的潜在影响是科学界最为关注的问题之一,因为这些环境条件不仅影响生态方面,还驱动基于遗传的适应性进化(Zhang等人,2023;Hou等人,2024;Xiang等人,2024)。局部适应是指本地基因型在其原生栖息地中比非本地基因型具有更高的适应性(Kawecki和Ebert,2004)。对局部适应的研究已经转向分析快速进化过程及其在应对环境变化中的作用(Hoffmann和Sgrò,2011),超出了早期对物种形成等长期现象的关注(Jordan,1905)。在全球气候变化的背景下,研究局部适应对于理解物种如何适应和多样化以应对气候条件施加的非生物选择压力至关重要。鉴于温度和降水是导致植物物种分化选择的主要因素(Rhone等人,2010;Fournier-Level等人,2011),局部适应研究的一个关键挑战是识别可能受到这两种气候因素影响的空间分化选择压力的异常位点(Savolainen等人,2013)。
作为全球生物多样性热点地区,青藏高原(QTP)对气候变化的敏感性和脆弱性高于其他地区,为研究物种如何进化和适应环境变化提供了独特的机会(Kang等人,2010;Zhang等人,2020)。QTP独特的地理位置和气候特征,包括低氧分压(Streb等人,2005)、强烈的紫外线辐射(Norsang等人,2011)以及局部荒漠化(Manel等人,2012),不仅促进了众多特有植物的出现,还显著增加了高原上草类物种的遗传多样性。
QTP的自然草原富含野生饲料种质资源,Carex属植物(莎草科)是高山草原的主要组成部分,其中56%的高山草地主要由这些物种构成(Yang等人,2012)。Carex capillifolia主要分布在北半球的温带至寒冷地区,在QTP地区的分布尤为集中。它对寒冷、辐射、干旱和强风的卓越耐受性使其成为维持草原生态平衡的关键元素,也是研究QTP局部适应机制的模型物种。尽管在高海拔地区面临恶劣的气候条件,C. capillifolia仍表现出显著的生长潜力和强大的适应性,表明它拥有许多其他植物物种所不具备的优越基因。然而,关于C. capillifolia的研究主要集中在其生理反应(Sun等人,2023)和生态功能(Wei等人,2015)方面,缺乏对其分子生物学的系统研究,这极大地阻碍了对其重要抗性基因和种质的探索。群体基因组学可以揭示不同种群之间的遗传变异,从而更好地评估遗传多样性,理解种群遗传过程(包括局部适应、基因流和人口动态),并阐明适应性和具有生态及经济重要性的复杂性状的基因组基础(Cao等人,2014)。此外,将基因型-环境关联(GEA)研究与群体基因组学相结合,有助于揭示许多植物物种适应性的遗传基础(Holliday等人,2010;Man等人,2019),以及评估它们抵御未来气候相关挑战的能力(Sang等人,2022;Xiang等人,2024)。
我们的研究小组在QTP地区的Ruoergai县(RRG)、Hongyuan县(HY)和Maqu县(MQ)发现了C. capillifolia的野生种群(图S1),证明了它们对干旱条件的强大适应性和抗性。在这项研究中,我们成功组装了C. capillifolia的染色体级基因组,并对来自这三个县的16个种群的178个个体进行了基因组重测序。利用全基因组变异数据,我们阐明了C. capillifolia种群的遗传多样性、种群结构和人口动态。我们还建立了基因组变异与环境因素(重点是温度和降雨)之间的关联,并鉴定出参与C. capillifolia>自然种群局部适应的关键位点。转录组分析揭示了与C. capillifolia>耐旱性相关的候选基因。本研究的结果提供了关于C. capillifolia>局部适应和耐旱机制的见解,并为相关物种的基因组研究和分子育种提供了宝贵的遗传资源。
章节片段
染色体级基因组组装和注释
使用长读长PacBio HiFi和Hi-C技术对一个C. capillifolia个体“MQ”进行了基因组测序。最初使用HiFiasm(Cheng等人,2021)组装了55.76 Gb(126.47×)的HiFi读长,得到了一个包含127个contig的386.65 Mb基因组,contig N50为14.66 Mb(表1)。BUSCO得分为96.20%,表明C. capillifolia基因组的质量很高。为了提高组装基因组的完整性,我们生成了一个Hi-C文库
讨论
C. capillifolia的染色体级基因组的可用性为探索其耐旱适应性的遗传和进化过程提供了基础。在这项研究中,我们从头组装了一个高质量的染色体级C. capillifolia基因组,基因组大小为386.65 Mb。利用PacBio HiFi和Hi-C测序技术,我们获得了在连续性和完整性方面优于以往发表的Carex基因组的组装结果
植物材料和基因组测序
从Maqu县(102.07°E, 33.86°N;QTP,中国)的沙漠地区收集的C. capillifolia野生样本‘MQ’(图S1)被用于基因组组装。为了获得C. capillifolia的长读长测序数据,根据Pacific Biosciences的标准协议构建了PacBio HiFi测序文库,并使用PacBio Sequel平台进行了测序。总之,高质量的基因组DNA被随机切割成平均长度为20 kb的片段,并进行了末端修复
未引用的参考文献
Escudero等人,2012;Gautier和Vitalis,2012;Hou等人,2016;Stank等人,2006;Song等人,2015;Wang等人,2015;Wang等人,2023;Wang等人,2012;Xu和Wang,2007;Zhang等人,2019;Zhang等人,2023。
数据可用性
评估论文结论所需的所有数据均包含在论文和/或支持信息文件中。所有测序数据,包括组装的基因组、基因组组装和注释的原始数据(Nanopore长读长、Illumina全基因组测序读长、转录组以及本研究中178个样本的全基因组重测序数据,已存入中国国家基因库数据库,项目编号为CNP0006572。来源数据是
CRediT作者贡献声明
熊艳丽:正式分析、监督、写作 - 原始草稿。于晴晴:可视化、调查、数据管理、写作 - 原始草稿。熊毅:概念化、正式分析、写作 - 原始草稿。尤明红:概念化、正式分析、可视化。何莉:正式分析、监督、调查、数据管理。吴国超:正式分析、可视化。彭静涵:可视化、调查、数据管理。严丽军:监督、写作 -致谢
本项工作得到了“天府青城计划”2023年科技创新领军人才项目;四川省林业和草原防治荒漠化重点实验室(KJZXSA202310);四川省“十四五”饲料育种研究项目(2021YFYZ0013-2);国家现代饲料产业技术体系(CARS-34);以及四川省饲料创新团队计划(SCCXTD-2020-16)的资助。