黄麻基因组中微型反向重复转座元件(MITE)的发掘及其插入多态性标记的开发与应用

【字体: 时间:2025年10月11日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对黄麻分子标记稀缺、遗传机制不明的问题,系统探索了两种栽培黄麻(Corchorus capsularis和C. olitorius)基因组中MITE的分布特征。研究发现5万余个MITE元件,其中大量位于基因区及近基因区,并预测出万余个MITE衍生miRNA。团队首次构建了黄麻全基因组MITE插入多态性(MIP)标记数据库,验证的15个标记成功将30份种质分为5个类群,为黄麻分子育种提供了高效工具。该研究为黄麻功能基因挖掘和遗传改良奠定了重要基础。

  
在可持续农业日益受到重视的今天,黄麻作为一种可生物降解的"黄金纤维"作物,因其在纺织、包装等领域的广泛应用和强大的碳汇能力而备受关注。然而,黄麻品质和产量的提升却长期受限于分子标记资源的匮乏以及对重要农艺性状分子机制认知的不足。尽管已有黄麻基因组草图发布,但对其基因组中活跃的遗传元件——特别是微型反向重复转座元件(Miniature Inverted-Repeat Transposable Elements, MITEs)的系统研究仍属空白。MITEs作为一类非自主转座元件,以其高拷贝数、偏好插入基因区域等特点,在基因调控和基因组进化中扮演着关键角色,同时也可作为开发分子标记的宝贵资源。
为了揭示黄麻基因组中MITEs的分布规律并开发实用的分子标记,研究人员对两个主要栽培种——长蒴黄麻(Corchorus olitorius, CO)和圆果黄麻(Corchorus capsularis, CC)进行了全基因组范围的MITE分析。研究采用MITE Tracker软件结合VSEARCH聚类算法,基于结构特征(长度50-800 bp、末端反向重复序列10-30 bp、靶位点重复2-10 bp)进行鉴定,并通过BLASTn比对进行全基因组注释。利用BEDTools分析MITEs的基因组位置(基因内、近基因区≤1 kb、基因间区)。通过BLASTn比较两物种间MITEs的保守性与独特性,并使用互惠最佳比对法鉴定直系同源MITEs。将MITE序列与miRBase数据库中的miRNA进行比对以预测MITE衍生miRNA,并通过PlantTFDB数据库和InterPro Scan鉴定MITE相关的转录因子。利用PANNZER2和WEGO进行基因本体(GO)富集分析。基于MITE侧翼序列设计MITE插入多态性(MIP)标记,并在30份黄麻种质(16份CO,14份CC)中进行PCR扩增和电泳检测,利用NTsysPC软件基于Nei遗传相似性指数和UPGMA法构建聚类树。从SRA数据库获取RNA-seq数据,使用Kallisto计算TPM值,分析含外显子区MITE插入基因的表达谱。
MITE在黄麻基因组中的鉴定
在CC和CO基因组中分别鉴定出51,369和50,829个MITE元件,归属于632和539个家族。这些MITEs被分为hAT-like、Tc1/Mariner、Mutator-like、PIF/Harbinger和CACTA等超家族。值得注意的是,CC中未发现CACTA超家族成员。两基因组间存在大量共同MITEs,但CC拥有8,351个特有MITEs,而CO仅有3,029个,暗示两物种在转座子活性和进化上存在差异。
MITE的基因组分布特征
MITEs约占CC基因组的4.58%,CO基因组的3.81%。大部分MITEs分布于基因间区(CC: 68.54%; CO: 64.39%),但仍有相当比例位于基因区(CC: 10.06%; CO: 10.66%)和近基因区(CC: 21.45%; CO: 25.04%)。在基因区插入的MITEs中,有相当部分位于外显子区(CC: 19.78%; CO: 30.88%),这可能直接影响基因功能。染色体分布分析显示MITEs的分布不均匀,CC中染色体4含量最高(8,849个),而CO中染色体2含量最高(7,446个)。滑动窗口分析进一步揭示了MITEs在染色体上的簇集现象。
MITE衍生miRNA及与转录因子的关联
研究预测了大量可能产生miRNA的MITE元件(CC: 1,246; CO: 1,368),表明MITEs是黄麻小RNA的重要来源。此外,在多个转录因子家族基因中发现了MITE插入,例如CO中MYB和NAC家族,CC中bHLH和MIKC_MADS家族。一些转录因子家族(如Whirly、Dof)仅在CO中发现MITE插入,而另一些(如NF-YB、HB-PHD)则特异存在于CC中,提示了两物种在基因调控网络上的分化。
含MITE基因的功能富集
GO分析表明,含MITE的基因广泛参与细胞组成、分子功能和生物过程。值得注意的是,CO的基因在次级代谢物生物合成(如类胡萝卜素、黄酮)和水杨酸响应过程中显著富集,而CC的基因则更富集于脂质代谢和维生素生物合成等初级代谢过程。这反映了MITE插入可能对不同黄麻物种的代谢途径产生了特异性的影响。
MIP标记的开发与应用
基于MITE侧翼序列,研究构建了全基因组范围的MITE插入多态性(MIP)标记数据库。从38个随机选择的标记中,筛选出15个具有多态性的标记。这些标记在30份种质中共检测到50个等位基因,平均每个标记2.66个等位基因,多态信息含量(PIC)平均为0.28。UPGMA聚类分析将30份种质清晰地划分为5个类群,显示了MIP标记在黄麻遗传多样性分析和种质资源分类中的有效性和实用性。
含MITE基因的表达分析
对含有外显子区MITE插入的基因在不同组织(如韧皮部、成熟花、叶、果实、茎、纤维细胞、全幼苗)中的表达分析发现,部分基因呈现组织特异性高表达,而另一些基因则在所有组织中均稳定表达,提示这些基因可能参与基础细胞过程。同时,也发现了一些在所有组织中均不表达的基因。
本研究首次对两种栽培黄麻基因组中的MITEs进行了全面系统的分析,揭示了其在基因组结构、基因调控和物种进化中的重要作用。研究发现黄麻基因组富含MITEs,且其分布具有物种特异性。大量MITEs位于基因或近基因区域,并可能作为miRNA的前体,暗示其对基因表达具有广泛的调控潜力。研究构建的MIP标记数据库及验证结果,为解决黄麻分子标记稀缺的瓶颈问题提供了切实可行的方案。这些标记因其共显性、位点特异性以及倾向于位于基因区域的特点,在遗传图谱构建、重要性状基因定位和分子标记辅助育种中具有巨大应用价值。该研究不仅深化了对植物转座元件生物学功能的理解,也为黄麻这一重要纤维作物的遗传改良和育种创新提供了宝贵的基因组资源和工具,对推动黄麻产业的可持续发展具有重要意义。未来研究可进一步利用这些MIP标记挖掘重要农艺性状相关基因,并通过功能实验验证MITE衍生miRNA的调控作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号