
-
生物通官微
陪你抓住生命科技
跳动的脉搏
杜仲线粒体基因组首次完整解析:揭示星类植物多染色体结构及争议性系统发育关系
【字体: 大 中 小 】 时间:2025年05月30日 来源:BMC Plant Biology 4.3
编辑推荐:
为解决杜仲(Eucommia ulmoides)线粒体基因组(mitogenome)组装不完整、系统发育位置存在争议等问题,南京林业大学研究人员利用PacBio HiFi测序技术首次完成杜仲多染色体结构线粒体基因组组装。研究发现其由两条环状染色体(MC1和MC2,总长541.7 kb)构成,含38个PCGs、21个tRNAs和2个rRNAs,重复序列占比21.67%。通过比较基因组和系统发育分析,证实杜仲属于lamiids基部分支,为理解植物线粒体基因组进化及核质基因组冲突提供了重要依据。
杜仲(Eucommia ulmoides)作为杜仲科唯一现存物种,既是传统中药材,又是重要的硬橡胶原料树。尽管其核基因组和质体基因组(plastome)已有研究,但线粒体基因组(mitogenome)的复杂性和争议性长期困扰学界——植物线粒体基因组以结构多变著称,从单环状到多染色体构型均有报道,且基因丢失和重组事件频繁,导致系统发育分析常出现核质基因组不一致(cytonuclear discordance)现象。更棘手的是,此前NCBI数据库中两个杜仲线粒体基因组版本(单环状和三染色体)因测序技术限制存在显著差异,亟需高精度组装解决争议。
南京林业大学林木遗传与生物技术教育部重点实验室的李萌、赵伟杰团队联合海军军医大学第一附属医院邱静团队,采用第三代PacBio HiFi测序技术完成杜仲线粒体基因组首次高质量组装,相关成果发表于《BMC Plant Biology》。研究通过PMAT和Oatk双软件验证,将541.7 kb的基因组解析为两条环状染色体(MC1: 298,869 bp;MC2: 242,800 bp),GC含量46.28%。关键技术包括:PacBio Revio平台HiFi长读长测序(平均读长13,618 bp)、重复序列分析(REPuter和MISA)、共线性比对(BLASTn)以及基于21个保守PCGs的最大似然法(ML)系统发育树构建。
多染色体结构与基因特征
研究发现杜仲线粒体基因组含61个基因(38个PCGs、21个tRNAs和3个rRNAs),其中nad1基因被分割在两条染色体上。启动密码子多样性显著:nad4L和rps4分别使用ACG/ACA(经RNA编辑),而mttB和rpl16起始密码子尚未确定。值得注意的是,9个PCGs含33个外显子和24个内含子,nad1/nad2/nad5同时存在顺式(cis-)和反式(trans-)剪接内含子,揭示剪接机制多样性。
重复序列驱动基因组进化
基因组中散布重复序列占比21.76%,包括209个SSRs(47%为四核苷酸)、50个串联重复和437对分散重复。其中长达16,227 bp的LR1重复可能介导MC2重组,解释其中等大小基因组(介于66 kb的Viscum scurruloideum和11.3 Mb的Silene conica之间)的形成机制。
系统发育与基因丢失模式
基于线粒体基因组和质体基因组的ML树均支持杜仲位于lamiids基部分支,与APG IV分类系统一致,但和核基因组支持的"lamiids+campanulids姐妹群"假说存在冲突。跨物种比较显示,陆地植物线粒体基因组存在趋同简化:石松类Haplomitrium mnioides保留42个PCGs,而杜仲等被子植物仅存24个核心PCGs(如atp1、cox1)和14个可变PCGs,核糖体蛋白基因(rps/rpl)丢失频率最高。
这项研究不仅填补了杜仲目(Garryales)线粒体基因组研究的空白,更揭示了多染色体结构的进化动力——大片段重复介导的同源重组可能是构型转变的关键。争议性的系统发育位置提示杜仲或成为研究核质基因组冲突的模型物种,为后续药用性状的遗传改良奠定基础。尤其值得注意的是,相比Illumina短读长组装,PacBio HiFi技术能更准确捕捉复杂结构,这对理解植物线粒体"环状主导模型"的局限性具有方法论启示。
生物通微信公众号
知名企业招聘