
-
生物通官微
陪你抓住生命科技
跳动的脉搏
重复序列模拟病原体相关模式:跨越广阔进化景观的病毒拟态机制研究
【字体: 大 中 小 】 时间:2025年09月25日 来源:Cell Genomics 9
编辑推荐:
本期推荐:为量化病毒拟态现象,研究人员开发了基于统计物理学的“选择力”框架,用于分析基因组中病原体相关分子模式(PAMPs)的富集机制。研究发现,不同重复序列家族通过富集CpG二核苷酸和双链RNA(dsRNA)等PAMP特征,可被模式识别受体(PRRs)识别并激活先天免疫。该研究揭示了病毒拟态在癌症、自身免疫性疾病和衰老等过程中的重要作用,为理解重复元件的免疫调控功能提供了进化视角。
在基因组生物学领域,一个引人入胜的现象逐渐浮出水面:我们自身的基因组中竟然潜伏着类似病毒的“特洛伊木马”。这些被称为重复序列的DNA片段,占人类基因组的一半以上,原本被表观遗传机制沉默,但在某些疾病状态下会被异常激活,产生能够触发免疫反应的分子模式——这种现象被称为病毒拟态(viral mimicry)。近年来,科学家发现病毒拟态不仅是癌症的特征,还出现在自身免疫性疾病、神经退行性疾病、病毒感染和衰老过程中,成为细胞功能障碍的一个基本特征。
近日发表在《Cell Genomics》上的研究论文“Repeats mimic pathogen-associated patterns across a vast evolutionary landscape”由Petr Sulc、Andrea Di Gioacchino和Benjamin D. Greenbaum等科学家合作完成,他们开发了一个创新的统计物理学框架来量化病毒拟态,并通过实验验证了其预测,揭示了重复序列模拟病原体模式的进化规律。
研究人员采用的最大熵模型(maximum-entropy model)能够计算“选择力”(selective forces),量化特定序列特征相对于基因组背景的富集程度。他们重点分析了两种典型的病原体相关分子模式(PAMPs):CpG二核苷酸(序列 motif)和双链RNA(dsRNA)(结构特征)。通过计算每个3000bp窗口的选择力,他们鉴定了富含PAMP的基因组区域。实验验证方面,他们使用RNA免疫共沉淀测序(RIP-seq)分析了ORF1p、ORF2p和ZCCHC3结合的L1转录本,同时利用J2抗体免疫沉淀双链RNA并进行测序分析。此外,还分析了来自黑色素瘤患者队列的RNA-seq数据,并将该方法应用于20个物种的基因组比较研究。

研究人员发现,人类基因组中高xCpG区域主要位于基因间区,且许多并非传统的“CpG岛”或特定调控区域。着丝粒周围卫星重复序列HSATII是高xCpG基因组区域中最具代表性的重复序列。通过比较原始共识序列与后续基因组拷贝的二核苷酸 motif进化,发现大多数重复家族具有中性模型预期的CpG二核苷酸作用力,但HSATII和年轻的Alu重复是显著例外。
LINE-1(L1)元件特别令人关注,它们占人类基因组的约20%。完全完整且具有蛋白质编码能力的L1 DNA序列(约146个拷贝)显示出CpG含量的高度富集。RIP-seq实验表明,ORF1p和ORF2p富集的L1转录本具有高xCpG,显著高于对照组。更重要的是,高xCpG L1 RNA更可能与先天免疫传感器ZCCHC3结合,这表明高xCpG与具有复制能力的L1和L1相关转录本的先天免疫感应相关。

通过模拟强选择-弱突变动力学,研究人员发现,在CpG位点受到强选择维持的情况下,轨迹在力轴上与无选择情景分离。对所有单个HSATII和L1插入的分析显示,HSATII的xCpG高于基于Kimura中性模型的预期,这意味着选择作用正在维持这些重复的高CpG含量。而非完整的全长L1s的CpG含量以可预测的方式衰减到基因组平均值,这与潜在的中性序列进化模型一致。
年轻Alu亚家族(如AluY和AluS)远离其预测平衡,仍保留PAMP样的高CpG含量,表明CpG富集与Alu亚家族的逆转座能力相关。
研究人员将框架扩展到RNA二级结构形成的偏向量化,定义了双链力(xds)来量化超过零模型预期频率的长双链片段的存在。他们在3000bp窗口扫描整个基因组,发现88%的高双链力区域(xds > 0.5)与已知重复序列重叠,且在编码区域中贫乏。超过43%的这些片段对应于AluS反向重复(IRs)。
通过基于柯尔莫哥洛夫复杂度(Kolmogorov complexity)的估计,他们验证了能够形成长dsRNA的区域并不限于简单重复区域,并检测到几个先前未注释的易于形成长dsRNA且具有高双链力的IRs。
实验验证表明,预测的dsRNA形成区域确实能够与PRRs结合。在患者来源的结直肠癌细胞系中,J2单克隆抗体(结合大于40bp的dsRNA)的配体测序显示,高xds区域在J2抗体结合转录本中富集,且与先前发表的MDA5激动剂具有相似谱。同样,在MDA5受体(感应长dsRNA的PRR)的激动剂基因组数据集中,MDA5配体显示出双峰分布,其中来自IRs的配体仅存在于高xds峰中。

研究人员在20个物种中检测了具有高CpG二核苷酸和dsRNA作用力的重复序列的存在和保守性,发现CpG二核苷酸和dsRNA的作用力在很大程度上是独立的。高xds异常区域出现在许多物种中,甚至包括那些缺乏Alu家族的物种,这表明可折叠区域并非Alu重复的特有功能,而可能是跨基因组转座子机制的通用副产品。
比较人科动物中重复家族的选择力显示,人类与其他猿类之间高xCpG序列的保守性随着进化距离的增加呈指数下降。人类基因组中近一半的高xCpG子序列与HSATII重叠,HSATII在Pongo属从其他大猿分支后出现在灵长类动物中。自插入基因组以来,HSATII序列的保守程度远高于高CpG池中的其他序列。
与高xCpG区域不同,高xds窗口更普遍地保存在人科动物的所有序列家族中,这表明它们与dsRNA先天受体结合的能力是该谱系中保守的表型特征。在高xds区域中,反向Alu重复自1600多万年前出现在灵长类基因组以来高度保守。
本研究提出了一个量化病毒拟态的理论框架,能够大规模量化免疫原性序列特征的富集程度。研究发现,PAMPs在跨物种特异性重复类别中强烈富集,强烈表明在所有物种中存在共享的进化约束。
研究人员提出了两个非互斥的假说来解释驱动PAMP富集的现象:一是“重复中心”假说,认为PAMPs对重复家族自身有益,PAMP富集有利于重复家族的生存和扩展;二是“生物体中心”假说,认为重复相关PAMPs通过作为失调细胞的信号直接增强生物体适应性,触发炎症并提高通过程序性细胞死亡或免疫监视消除失调细胞的几率。
这些发现对癌症治疗具有重要启示。研究表明,病毒拟态影响癌症进化,在黑色素瘤中,早期重复序列表达与炎症信号和更好预后相关。同样,输卵管癌前病变显示早期表达dsRNA形成重复序列, consequent的慢性病毒拟态反应塑造了转化后的抗肿瘤免疫反应。慢性干扰素信号传导与免疫治疗耐药性相关。通过使用dsRNA力注释和RNA表达对患者进行分层,显示与生存率相关,这与病毒拟态是肿瘤适应性挑战的假说一致。
该研究还表明,具有形成dsRNA和富集CpG能力的区域分布在基因组中,在DNA甲基化、染色质组织和RNA代谢等多个细胞过程 disrupted 时,它们可以作为更广泛病毒拟态警告系统的触发器。重复序列表达可以作为p53功能丧失的备份,DNA损伤反应和先天免疫可能在漫长的进化时间尺度上共同进化。
研究人员假设,这种重复介导的免疫反应在发育过程中特别重要,此时急性感染、转录失调或基因组 destabilizing 内源性逆转录元件的潜在灾难性,特别是在完全分化的免疫系统的协同反应尚未形成的情况下。早期癌症中的干细胞样细胞可能重新激活这种反应,随着肿瘤进展,它们很可能适应以逃避它。
该研究的局限性包括需要未来工作来 fully elucidate 这一现象的广度和机制,以及在重复基因组区域传统遗传工具可能缺乏效力。此外,在先天免疫功能与重复序列在被驯化到基因组中可能执行的其他调节功能之间缺乏完全区分。
总之,这项研究通过创新的统计物理学框架和实验验证,揭示了重复序列模拟病原体模式的进化规律和功能意义,为理解病毒拟态在健康和疾病中的作用提供了新视角,为未来治疗策略开发奠定了基础。
生物通微信公众号
知名企业招聘