染色体水平基因组解析揭示沙棘适应性进化与性别决定机制

【字体: 时间:2025年08月29日 来源:Scientific Data 6.9

编辑推荐:

  本研究通过整合PacBio HiFi长读长、Illumina短读长和Hi-C技术,首次构建了喜马拉雅特有雌雄异株树种沙棘(Hippophae salicifolia)的高质量染色体级别参考基因组(1.11Gb,scaffold N50 95.29Mb)。该研究解决了该物种基因组资源匮乏的问题,预测出42,547个蛋白编码基因,揭示LTR反转座子占基因组32.54%,为探究青藏高原植物适应性进化、XY性别决定系统及资源开发利用提供了关键分子基础。

  

在青藏高原的极端环境中,沙棘属植物以其独特的抗逆性和生态价值成为研究热点。其中喜马拉雅特有种Hippophae salicifolia(柳叶沙棘)因其雌雄异株特性、Frankia根瘤固氮能力以及富含维生素C的果实备受关注。然而,该物种基因组信息的缺失严重阻碍了对其性别决定机制(XY系统,2n=24)和极端环境适应性的深入研究。尽管已有沙棘(H. rhamnoides)、西藏沙棘(H. tibetana)等近缘种的基因组报道,但H. salicifolia的遗传密码仍待破译。

为解决这一科学瓶颈,Zhefei Zeng等研究团队在《Scientific Data》发表了首个染色体级别的H. salicifolia基因组。研究人员采集西藏山南市错那县勒布沟景区的雌株样本(凭证标本LQ20240672),采用多组学技术路线:PacBio Sequel II平台生成28.69×覆盖度的HiFi长读长(平均15.94kb),结合56.65×Illumina短读长和92.42×Hi-C数据,通过hifiasm v0.19.9组装后经Juicer v2.0和3D-DNA进行染色体锚定。

基因组特征

组装结果显示基因组大小1.11Gb,GC含量29.76%,仅含210个缺口。通过RepeatModeler v2.0.1鉴定重复序列占比45.25%,其中LTR反转座子占32.54%(Ty1/Copia 12.96%,Gypsy/DIRS1 17.62%)。BUSCO评估显示组装完整度达98.8%,Merqury验证碱基错误率低至1.32×10-4

基因注释

整合EVM和PASA流程预测42,547个蛋白编码基因,平均含4.72个外显子。功能注释覆盖85.06%基因,KEGG注释揭示大量与抗逆性和次生代谢相关通路。非编码RNA鉴定发现5,924个rRNA和748个tRNA,为调控机制研究奠定基础。

比较基因组学

通过JCVI v1.2.7与近缘种比较显示12条染色体(Chr01-Chr12)高度保守,其中Chr08(95.29Mb)呈现特殊GC含量(28.34%),可能关联性别决定区域。

该研究建立的基因组资源为解析沙棘属物种的三大科学问题提供了钥匙:1)XY性别决定系统的分子基础;2)青藏高原极端环境适应的遗传机制;3)药用成分(如黄酮类)合成通路演化。此外,基因组指导的分子标记开发(如文献10所述性别特异性Indel标记)将加速沙棘遗传育种进程。

研究人员特别指出,相较于已发表的沙棘属基因组,本研究的scaffold N50(95.29Mb)和BUSCO完整度(99.3%)达到领先水平。未来可结合该基因组开展:1)性别相关基因的共线性分析;2)LTR爆发与高原适应性关联研究;3)Frankia共生固氮的宿主遗传基础探索。这项成果为青藏高原生物多样性保护与特色植物资源开发提供了分子层面的"导航图"。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号