四倍体红景天染色体水平基因组解析:高原药用植物遗传基础与药用价值的新突破

【字体: 时间:2025年04月15日 来源:Scientific Data 5.8

编辑推荐:

  为解决高原药用植物红景天(Rhodiola kirilowii)基因组资源匮乏制约其药用开发的问题,四川草地科学研究院团队通过Illumina/PacBio/Hi-C多组学技术,成功构建首个染色体水平的四倍体红景天参考基因组(1.92Gb,NG50 46.03Mb),注释122,035个蛋白编码基因和63.88%重复序列,发现40条同源染色体和1条性染色体。该研究为解析其解毒抗肿(anti-swelling)和适应原(adaptogen)特性的分子机制奠定基础,对推动藏药现代化和抗高原反应药物研发具有重要意义。

  

在青藏高原的悬崖峭壁间,生长着一种被誉为"高原人参"的珍贵药用植物——红景天(Rhodiola kirilowii)。这种隶属于景天科(Crassulaceae)的多年生草本,其根茎在藏医经典《四部医典》中记载具有平衡肺热、解毒消肿的神奇功效,现代研究更发现其富含红景天苷(salidroside)、酪醇(tyrosol)等活性成分,具有抗缺氧、抗疲劳、抗衰老等药理作用。然而,这种传统药材的开发利用却面临重大瓶颈——由于缺乏高质量的基因组参考序列,其药用成分的生物合成机制和适应高原环境的遗传基础始终笼罩在迷雾之中。更棘手的是,红景天作为四倍体植物,其复杂的基因组结构使得常规测序技术难以破解其遗传密码。

为攻克这一难题,四川草地科学研究院联合西南科技大学的研究团队展开了一项雄心勃勃的基因组计划。研究人员从海拔3495米的红原高原药用植物育种基地采集样本,采用多组学整合策略:首先通过Illumina短读长测序(90.92Gb)进行基因组调查,结合PacBio Revio长读长测序(185.32Gb)获得连续contigs,再借助Hi-C技术(276.01Gb)将基因组提升至染色体水平。创新性地运用MaSuRCA v4.0.7混合组装和3D-DNA染色体挂载流程,最终获得包含40条同源染色体和1条性染色体的完整基因组,大小达1.92Gb,scaffold NG50达46.03Mb,BUSCO完整性评估高达98.9%。通过21-mer分析揭示其四倍体特性,荧光显微镜直接观察到41条(4n=40+1)染色体。基因组注释发现63.88%的重复序列和122,035个蛋白编码基因,各亚基因组间呈现高度相似的完整性和连续性。

关键技术方法包括:1) 多平台测序策略组合(Illumina+PacBio+Hi-C);2) MaSuRCA混合组装与POLCA校正;3) 3D-DNA染色体挂载与Juicebox可视化调整;4) BRAKER3整合RNA-seq和同源数据的基因预测;5) 基于Merqury和BUSCO的质量评估体系。样本来源于四川红原高原基地的xh-4品系。

背景与样本

研究团队在青藏高原东缘的四川红原基地(北纬32.7752°,东经102.5442°)采集野生型R. kirilowii(xh-4),该区域海拔3495米,是典型的红景天自然栖息地。新鲜叶片经液氮速冻后,采用高纯度DNA提取方案构建三种测序文库。

基因组特征

17-mer分析预测基因组大小为2.26Gb,杂合率0.39%,重复序列占比92.49%。荧光显微图像清晰显示4n=40+1的染色体构型。最终组装覆盖1.92Gb,包含9015个contigs,N50达474kb,通过Hi-C将97.3%序列锚定到41条染色体。

多倍体解析

fastANI分析鉴定出四套同源染色体组(haplotype1-4),ANI值显示高度相似性(>99%)。其中ChrIX仅存在单套拷贝,被确认为性染色体。各亚基因组大小在511-572Mb之间,编码基因数量为25,446-28,034个。

功能注释

RepeatMasker鉴定出占基因组63.88%的转座元件(TE)。通过整合RNA-seq、同源比对和de novo预测,注释出122,035个蛋白质编码基因,其中94.5%的BUSCO基因呈现复制状态,反映四倍体特性。非编码RNA预测发现大量tRNA、rRNA等调控元件。

质量验证

Merqury评估显示92.56%的k-mer回收率,Illumina reads比对率达99.15%。BUSCO检测eudicots_odb10数据集显示基因组完整性98.9%(仅0.8%碎片化),蛋白注释完整性98.9%(97.3%为复制基因)。

这项研究创造了多个"第一":首个染色体水平的四倍体红景天基因组,首个解析同源染色体组的景天科植物参考序列,也是目前已知最大的红景天属基因组(较二倍体版本大3倍)。该成果为阐明红景天苷等活性成分的生物合成通路提供了基因"蓝图",其揭示的性染色体机制为研究高原植物性别决定进化提供新线索。从应用角度看,这套高质量基因组将加速分子标记辅助育种,助力培育高药用价值品种;从科学价值论,其为多倍体植物基因组进化研究树立了新范式。数据已存入EBI(GCA_965206585)和NGDC(GWHFGNY00000000),将成为青藏高原特色药用植物研究的基石资源。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号