芸香科叶绿体基因组比较研究:结构分化、适应性进化与系统发育基因组学启示
【字体:
大
中
小
】
时间:2025年10月06日
来源:Frontiers in Plant Science 4.8
编辑推荐:
本综述系统比较了35种芸香科植物叶绿体基因组,揭示了其典型四部分结构(LSC/SSC/IRs)的高度保守性及IR边界特异性变异。研究发现AT富集单核苷酸重复序列(SSR)主导非编码区,同义密码子使用偏好(RSCU)分析显示显著异质性(0.386-1.797),ENC-GC3s与PR2分析表明偏离中性进化。选择压力分析证实光合系统基因受强纯化选择(Ka/Ks < 0.2),而matK、rpl20等基因呈现正选择信号,为芸香科分类修订与适应性进化机制提供分子框架。
叶绿体作为植物光合作用与代谢关键细胞器,因其母系遗传、结构保守和中等进化速率的特点,已成为系统发育重建、物种鉴定和进化研究的重要工具。典型叶绿体基因组呈现环状四部分结构,包含大单拷贝区(LSC)、小单拷贝区(SSC)和一对反向重复区(IRs),编码约110-150个基因,主要涉及光合作用、转录、翻译及代谢调控。高通量测序技术的进步显著推动了叶绿体基因组研究,但在芸香科尤其是九里香属及其近缘物种中,比较研究仍相对有限,缺乏系统表征阻碍了对该谱系进化历史和适应策略的全面理解。
研究收集福建福州地区的九里香新鲜叶片,通过改良CTAB法提取DNA,使用DNBSEQ-T7平台进行高通量测序。叶绿体基因组组装采用oatk工具,使用k-mer大小为1001,覆盖度阈值150,线程数为8。注释通过GeSeq工具完成,并经Sequin软件手动校正。SSR分析使用IMEx v2.1软件,设定单核苷酸重复≥10次,二核苷酸≥5次,三核苷酸≥4次,四至十核苷酸≥3次。密码子使用偏好通过相对同义密码子使用度(RSCU)评估,有效密码子数(ENC)与GC3s关系、中性绘图及PR2分析用于揭示进化驱动力。共线性分析使用genoPlotR包,选择压力通过Ka/Ks Calculator v2.0计算,系统发育重建基于最大似然法(RAxML-NG)完成。
九里香叶绿体基因组全长160,179 bp,呈现典型四部分结构:LSC区87,592 bp,SSC区18,599 bp,IR区各26,994 bp。总GC含量38.64%,编码区长度79,755 bp,包含131个基因(86个蛋白编码基因、8个rRNA基因、37个tRNA基因)。光合作用相关基因如psaA/B、psbC/D/E/F等主要位于LSC区。比较35种芸香科物种显示,基因组大小范围155-161 kb,GC含量38.17-38.83%,基因数122-144,表明高度保守性。核苷酸组成显示一致AT偏好,平均碱基比例为A(30.46%)、T(31.10%)、C(19.58%)、G(18.86%)。GC含量沿密码子位置呈梯度分布:GC1(平均46.16%)> GC2(38.34%)> GC3(31.83%),第三位GC含量(GC3s)平均28.98%,显示显著AT偏好。编码区平均长度78,245 bp(占基因组49.38%),非编码区平均68,392 bp;编码区GC含量(38.78%)显著高于非编码区(35.08%),反映更强功能约束。
共识别4,517个SSR位点,单核苷酸重复(MonoSSR)占比59.11%,其次为八核苷酸(OctaSSR,12.51%)和九核苷酸重复(NonaSSR,8.30%),六核苷酸(HexaSSR,0.18%)和七核苷酸重复(HeptaSSR,0.07%)极罕见。物种间SSR组成存在差异,例如Leionema ellipticum的单核苷酸比例显著高于Eriostemon australasius。多数SSR motif呈现显著AT富集,GC富集重复(如C或G核苷酸组成)相对少见。基因组分布非随机:55.83%位于基因间隔区(IGS),31.61%在内含子区,仅12.55%在编码序列(CDS),表明SSR更易在弱选择约束区积累。
RSCU值范围0.386-1.797,证实所有物种存在非随机同义密码子使用。20种氨基酸中,色氨酸(Trp,UGG)和蛋氨酸(Met,AUG)仅由单一密码子编码,其余18种由2-6个同义密码子编码。3个密码子显示强偏好使用:AGA(Arg,RSCU=1.753)、UUA(Leu,RSCU=1.732)和GCU(Ala,RSCU=1.702);19个密码子显著低使用(RSCU < 0.6),如UAC(Tyr,RSCU=0.406)、AGC(Ser,RSCU=0.417)和GGC(Gly,RSCU=0.424)。近缘属(如柑橘属与九里香属)显示高度相似RSCU谱,而远缘类群(如Boronia和Zanthoxylum)呈现 divergent 模式,反映谱系特异性进化轨迹。
ENC值范围51.00-53.78(平均52.10),GC3s变化0.275-0.294(平均0.281),表明密码子使用存在中度偏倚。ENC-GC3s散点图显示绝大多数基因数据点位于理论期望曲线上方,平均ENC值(52.10)显著低于中性期望值61.0,支持密码子使用不仅受突变偏倚影响,也受自然选择驱动。柑橘属(如C. reticulata和C. sinensis)和九里香属物种显示高度相似分布模式,而Boronia ternata和Zanthoxylum nitidum等远缘属呈现 distinct 模式,表明密码子使用偏倚经历了谱系特异性适应分化。
分析3,041个蛋白编码基因,GC3范围0.3054-0.3238(平均0.3110),GC12范围0.4294-0.4308(平均0.4295)。GC3与GC12线性回归斜率范围-0.0834至0.1030(平均0.0326),R2值较低(0-0.0191,平均0.0033),表明自然选择而非突变偏倚在塑造芸香科叶绿体基因组密码子使用模式中起主导作用。
A3/(A3+T3)平均比率0.4694±0.0747,显著低于中性期望0.5(p<0.01),显示T优于A的偏好;G3/(G3+C3)平均比率0.5369±0.0993,显示中度G优于C的偏倚。PR2图中多数基因数据点聚集在第四象限(A3/(A3+T3) < 0.5且G3/(G3+C3) > 0.5),支持存在定向碱基使用偏倚。该不对称模式在芸香科各谱系间高度保守,暗示共享选择背景。属水平也显示谱系特异性特征:柑橘属物种(n=174)G3/(G3+C3)=0.5375、A3/(A3+T3)=0.4708,而九里香属物种(n=268)G3/(G3+C3)=0.5406、A3/(A3+T3)=0.4672。
第一和第二轴共同解释密码子使用偏倚(CUB)总变异的16.54%(轴1占8.76%,轴2占7.78%),表明芸香科叶绿体基因组密码子使用由多重互作因素塑造,包括突变偏倚、翻译选择及可能的功能约束。尽管种间差异明显,多数物种呈现相似分布趋势,例如九里香属和柑橘属多数编码序列(CDSs)聚集在图中部,反映相对保守CUB landscape,少数基因位于外围,指示可能与差异基因表达或谱系特异性选择相关的独特密码子使用偏好。
35种芸香科物种叶绿体基因组保持高度保守四部分结构(LSC–IRb–SSC–IRa),基因顺序 largely 保守。关键光合基因(psaA/B)和ATP合酶基因(atpA/F)的基因组位置完全保守,近缘分类群呈现高度共线性模式,证实叶绿体基因组结构在近缘芸香科谱系间进化缓慢。系统发育重建进一步澄清芸香科科内关系:亚热带果用属(如柑橘属、九里香属和Clausena)聚为单系群,温带木本属(如Zanthoxylum、Tetradium和Phellodendron)形成 distinct 支系,澳大利亚特有属(如Boronia和Crowea)位于系统树基部。共线性分析显示编码光合作用相关基因、核糖体蛋白和tRNAs的基因组区域高度保守,但在某些物种IR边界附近也观察到基因重排。
83个基因比较中,77%基因受强纯化选择(Ka/Ks < 0.5),核心光合基因如psaB和psbA/B/C/D显示最强选择约束(Ka/Ks < 0.05),而clpP、accD和rpl20等基因呈现显著正选择信号(Ka/Ks > 1.5)。功能比较显示核糖体蛋白基因平均Ka/Ks比(0.42)显著高于ATP合酶基因(0.11),反映细胞功能间突变耐受梯度。NDH复合体基因显示最多样选择 profile,部分成员接近中性进化阈值,可能源于环式电子传递中的功能冗余。定量分析表明77.1%基因受强纯化选择(Ka/Ks < 0.5),14.5%呈现弱纯化选择(0.5 < Ka/Ks ≤ 1.0),仅8.4%基因比较显示潜在正选择迹象(Ka/Ks > 1.0),多数正选择信号与NDH复合体特定成员和假设蛋白相关。
基于完整叶绿体基因组数据的最大似然系统发育树显示,所有研究物种形成高支持单系群,验证当前分类 placement。九里香属和柑橘属物种聚集成高支持支系,表明两属间密切遗传关系;该支系进一步与Clausena、Glycosmis和Micromelum聚集成更大进化 lineage,反映这些属间紧密系统发育亲缘性。多数内部节点具高 bootstrap 支持值,种间遗传距离分析表明相对近期分化事件(平均Ks值0.0241),提示研究芸香科物种可能经历了相对近期适应辐射事件。
通过比较35种芸香科叶绿体基因组,本研究系统阐明了该科在基因组结构、重复序列分布和选择压力方面的进化特征。结果证实芸香科叶绿体基因组呈现典型且高度保守四部分结构,基因组大小、GC含量和基因数均落在被子植物叶绿体基因组典型范围内。IR边界变异和单核苷酸SSR的强AT富集偏好反映非编码区在基因组进化中的可塑性,该模式与近期柑橘属、Glycosmis及豆科研究一致。共线性分析进一步揭示关键光合基因(如psaA/B、psbC/D)和ATP合酶基因(atpA/F)顺序完全保守,而IR边界检测到的谱系特异性重排可能与科内生态适应相关。
叶绿体基因组密码子使用偏倚(CUB)分析为芸香科进化驱动力提供新视角。密码子使用模式显著异质(RSCU值0.386-1.797),高偏好密码子(如AGA、UUA、GCU)以A或T结尾,与基因组整体AT富集性质(平均AT含量61.56%)一致,支持突变偏倚在塑造密码子使用偏倚中的主导作用。然而,ENC-GC3s分析和中性绘图(GC12–GC3)显示经验数据点显著偏离理论中性曲线(平均回归斜率0.0326,R2=0.0033),表明自然选择在约束密码子使用中也起重要作用,尤其对于高表达光合作用相关基因如psbA和rbcL。PR2分析进一步揭示第三位置碱基使用不对称(A3/T3=0.4694,G3/C3=0.5369),该偏离中性期望(0.5)的现象在芸香科谱系间高度保守,可能反映长期选择压力塑造的进化平衡。
选择压力分析揭示芸香科叶绿体基因组基因功能分化与适应进化间复杂关系。Ka/Ks分析表明77.1%基因受强纯化选择,核心光合基因如psbA和psaB显示最强选择约束,与其维持光合效率的重要角色一致。值得注意的是,clpP、accD和rpl20等基因呈现显著正选择信号,表明它们参与芸香科物种适应分化。选择压力在功能类别间变异显著:核糖体蛋白基因(平均Ka/Ks=0.42)受约束弱于ATP合酶基因(0.11),反映细胞功能间突变耐受梯度。NDH复合体基因显示最多样选择 profile,部分成员接近中性进化阈值,可能源于环式电子传递中的功能冗余。
本研究构建的系统发育树为解析芸香科分类关系提供 essential 分子证据。基于完整叶绿体基因组数据的最大似然树强支持九里香属和柑橘属的单系性,与其共享形态特征(如羽状复叶和芳香花朵)和对亚热带环境生态适应一致。值得注意的是,Clausena、Glycosmis和Micromelum支系形成九里香属-柑橘属分支的姐妹 lineage,提示这些属可能共享关键进化创新。与基于少数位点(如ITS或matK)的传统系统发育分析相比,全叶绿体基因组数据显著增强节点支持值,尤其在解析九里香属属内复杂关系方面。然而,某些澳大利亚特有属(如Boronia)的系统发育 placement 仍模糊,可能反映早期快速辐射事件导致的不完全谱系分选。
本研究对35种芸香科叶绿体基因组的全面比较分析,包括新测序的九里香,揭示了高度保守四部分结构 alongside 谱系特异性变异 in 基因组大小、SSR分布、密码子使用偏倚和IR边界 dynamics。观察到的密码子使用模式、选择压力信号和系统发育重建共同 underscore 纯化选择和适应进化在塑造科内叶绿体基因组架构中的双重影响。值得注意的是,关键光合和翻译基因呈现强保守性,而rpl20和clpP等基因显示正选择证据,指示它们在谱系特异性适应中的潜在角色。九里香的 robust 系统发育 placement 增强我们对其与经济重要属如柑橘属和Clausena进化关系的理解。这些发现为芸香科分类澄清、进化研究和生物多样性保护提供宝贵基因组资源和 refined 分子框架。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号