三白草科植物叶绿体基因组的结构特征与系统发育基因组学意义
【字体:
大
中
小
】
时间:2025年10月01日
来源:BMC Genomics 3.7
编辑推荐:
本研究针对三白草科(Saururaceae)内部系统发育关系长期存在不一致的问题,首次报道了裸蒴(Gymnotheca involucrata)和峨眉鱼腥草(Houttuynia emeiensis)的叶绿体基因组,并补充了中华三白草(Saururus chinensis)的基因组数据。通过比较基因组学分析,揭示了该科植物叶绿体基因组的高度保守性,鉴定出ycf1、ndhF等13个突变热点区域,并基于全基因组数据解析出两大进化枝:无花苞柄的Anemopsis-Houttuynia支和有花苞柄的Gymnotheca-Saururus支。该研究为木兰类植物中胡椒目的系统发育研究提供了关键分子证据,对理解被子植物花被结构的演化具有重要意义。
在植物演化研究领域,三白草科(Saururaceae)作为一个古老而残存的家族,始终带着神秘的面纱。这个仅包含4属7种的珍稀植物群体,不仅具有独特的"无被花"结构(缺少花瓣),还呈现典型的东亚-北美间断分布格局,成为研究植物地理学和系统发育的经典材料。然而令人困扰的是,基于形态学数据、核基因和叶绿体基因的不同研究,竟给出了相互矛盾的系统发育关系,这使得三白草科的进化历程仿佛蒙上了一层迷雾。
更令人感兴趣的是,这个科中的鱼腥草属(Houttuynia)还存在分类学争议——2001年报道的新种峨眉鱼腥草(H. emeiensis)是否成立?各属间真实的亲缘关系如何?这些问题的解答对于理解木兰类植物中胡椒目的演化,特别是花被结构的进化轨迹具有关键意义。
正是在这样的科学背景下,Sun等研究人员在《BMC Genomics》上发表了突破性研究。他们首次解析了裸蒴(Gymnotheca involucrata)和峨眉鱼腥草(Houttuynia emeiensis)的叶绿体基因组,并补充了中华三白草(Saururus chinensis)的基因组数据,使得三白草科所有7个物种的叶绿体基因组得以完整呈现。这项研究采用了高通量测序技术(Illumina HiSeq-2500平台),通过GetOrganelle软件进行基因组组装,使用PGA和Geneious进行注释,并利用mVISTA、REPuter、MISA等工具进行了比较基因组学分析。样本来自遵义师范学院农业科学站的种质资源圃,确保了材料的可靠性和可追溯性。研究人员还采用了最大似然法(ML)和贝叶斯推断(BI)等多种系统发育分析方法,构建了 robust 的进化树。
研究显示所有7个三白草科植物的叶绿体基因组都呈现典型的四分体结构,长度在160,226-161,556 bp之间,包含131个基因(114个唯一基因)。这些基因组在基因顺序、重复组成和密码子使用模式上高度保守,特别是鱼腥草属的两个物种几乎完全一致。GC含量在IR区显著较高(42.93-43.03%),这主要由于4个rRNA基因(rrn16、rrn23、rrn4.5、rrn5)的重复存在。
密码子使用偏好分析发现,三白草科植物明显偏爱以A/T结尾的密码子,亮氨酸和异亮氨酸使用频率最高。简单重复序列(SSR)分析显示,单核苷酸重复占主导地位(72.38%),且A/T motif频率显著高于C/G motif。长重复序列分析表明,正向重复和回文重复是最常见的类型,30-39 bp长度的重复序列最为丰富。值得注意的是,不同属间的重复序列数量存在明显差异,这可能成为属间鉴别的基因组标记。
通过Mauve分析发现三白草科质体基因组完全共线性,没有基因重排或易位现象。IR/SC边界区域高度保守,ndhF和ycf1基因分别跨越SSC/IRb(JSB)和SSC/IRa(JSA)边界。mVISTA比较显示编码区(外显子和tRNA/rRNA位点)的序列保守性显著高于非编码区。
研究人员计算了核苷酸多样性(Pi)值,发现非编码区的Pi值(平均0.0388)约为编码区(平均0.0144)的两倍以上。在编码区识别出5个突变热点(ycf1、ndhD、ndhF、ccsA、matK;Pi>0.03),在非编码区识别出8个突变热点(如rpl32_trnL-UAG、rps16_trnQ-UUG等;Pi>0.06)。这些突变热点区域有望成为物种界定和种群水平研究的分子标记。
基于完整质体基因组、编码序列(CDS)、基因间隔区(IGS)以及CDS+IGS组合数据构建的系统发育树获得了一致的结构,强烈支持三白草科的单系性(100%)及其四个组成属的单系性。分析结果强烈支持Anemopsis和Houttuynia为姐妹群(100%),Gymnotheca和Saururus为姐妹群(100%),对应了花苞柄的缺失与存在这一形态特征:Anemopsis和Houttuynia缺少花苞柄,而Gymnotheca和Saururus具有花苞柄。
特别值得注意的是,H. emeiensis和H. cordata在系统发育树上聚集在一起,但支持率极低(完整叶绿体基因树中为78.80%,其他三种树中为0%),结合它们在基因组大小、GC含量、SC/IR边界和重复序列上的高度一致性,研究表明这两个物种可能是同种的,但需要进一步证据验证这一假设。
研究结论表明,三白草科植物的叶绿体基因组在大小、GC含量、IR/SC边界和密码子使用偏好方面高度保守,但重复序列在属间存在显著变异。系统发育分析强烈支持科内分为两大支系:无花苞柄的Anemopsis-Houttuynia支和有花苞柄的Gymnotheca-Saururus支,这一发现为理解花被结构的演化提供了新的视角。
该研究的重要意义在于首次提供了三白草科所有物种的完整叶绿体基因组数据,解决了长期存在的系统发育关系争议,揭示了基因组结构变异与形态特征(花苞柄)的关联性。发现的13个突变热点为后续的物种鉴定和种群遗传学研究提供了可靠的分子标记。此外,研究对H. emeiensis分类地位的质疑也为该物种的重新评估提供了基因组学证据。这些发现不仅深化了对三白草科进化 history 的理解,也为木兰类植物中胡椒目的系统发育研究提供了宝贵数据,对研究被子植物花被结构的演化具有重要启示意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号