
-
生物通官微
陪你抓住生命科技
跳动的脉搏
灵长类谱系中隐秘内源性逆转录病毒亚家族的发现:系统发育分析揭示调控进化新机制
【字体: 大 中 小 】 时间:2025年07月19日 来源:SCIENCE ADVANCES 11.7
编辑推荐:
本研究针对内源性逆转录病毒(ERV)及其长末端重复序列(LTR)分类不准确的问题,通过系统发育分析和跨物种保守性研究,在灵长类特异的MER11A/B/C亚家族中发现4个新亚家族,重新注释了19.8%的重复元件。利用大规模平行报告分析(MPRA)验证其调控潜力,揭示了SOX相关基序的物种特异性获得机制。该研究为理解ERV在宿主基因组中的功能进化提供了新视角。
在人类基因组中,近8%的序列源自内源性逆转录病毒(ERV),这些"基因组化石"不仅记录着远古病毒感染的历史,更通过其长末端重复序列(LTR)持续影响着宿主的基因调控网络。然而,当前基于RepeatMasker的ERV/LTR注释方法存在分辨率不足、分类不准确等问题,严重限制了对这些重复元件功能进化的理解。特别是在灵长类谱系中,年轻ERV亚家族的快速扩张与分化形成了复杂的调控元件库,但如何准确解析这些元件的系统发育关系和功能异质性,成为领域内亟待解决的科学难题。
针对这一挑战,中国科学院的研究团队在《SCIENCE ADVANCES》发表重要成果。研究人员创新性地结合系统发育分析与跨物种保守性研究,对53个灵长类富集的LTR亚家族进行重新注释。研究首先通过liftOver分析筛选出179个灵长类特异的LTR亚家族,聚焦MER11A/B/C等年轻亚家族,采用MAFFT多序列比对和IQ-TREE系统发育重建,结合表观遗传特征和功能验证,建立了全新的ERV注释框架。
关键技术方法包括:(1)基于MAFFT和IQ-TREE的系统发育树构建;(2)跨40余种灵长类物种的liftOver保守性分析;(3)染色质可及性(ATAC-seq)和组蛋白修饰(H3K27ac)的表观遗传分析;(4)整合16,929个LTR序列的大规模平行报告分析(MPRA);(5)基于Plink2的基序关联分析。
研究结果部分:
"灵长类谱系中LTR亚家族的异质性"揭示MER11A/B/C亚家族存在非正态分布的替代率,通过中值连接网络分析发现其可分为4个新亚家族(MER11_G1-G4),重新注释了412个(19.8%)基因组元件。
"MER11新亚家族展现更一致的表观遗传特征"显示不同新亚家族在hESC中呈现特异的染色质开放状态和转录因子结合模式,如MER11_G3富集ZNF136等锌指蛋白结合位点,而MER11_G4则获得SOX相关基序。
"MPRA验证MER11新亚家族的调控潜力"证实框架2序列具有更强增强子活性,鉴定出ZIC3、TEAD4等关键转录因子基序,发现新亚家族间的基序富集差异显著高于原始注释。
"人类MER11新亚家族在灵长类谱系中的独立扩张"比较分析显示,人类与猕猴的MER11_G4亚家族虽共享POU2F1::SOX2基序,但仅人类谱系通过单核苷酸缺失获得SOX15/17基序,导致增强子活性显著提升。
"灵长类谱系中隐秘ERV亚家族"将方法扩展到53个LTR亚家族,定义75个新亚家族,发现30%的实例需要重新注释,如LTR7亚家族可分为12个具有细胞类型特异性的功能亚群。
研究结论指出,这种基于系统发育的ERV注释方法解决了传统分类法分辨率不足的核心问题。特别重要的是,在MER11_G4亚家族中发现的单核苷酸缺失事件,导致人类特异性获得SOX转录因子结合能力,这可能驱动了该亚家族在人类谱系中的选择性扩张。对LTR7等亚家族的重新分类,更揭示了不同进化分支获得特定细胞类型调控功能的分子轨迹。该研究不仅为ERV功能进化研究建立了新范式,其开发的phylo-TEbase数据库(补充材料)更为探索重复元件在物种形成和疾病发生中的作用提供了重要资源。未来,这种整合系统发育与功能分析的策略,或将在转座元件介导的基因组进化研究中发挥更广泛的价值。
生物通微信公众号
知名企业招聘