SARS-CoV-2中高度复发的多核苷酸突变揭示转录调控序列相关的新型突变模式

《Molecular Biology and Evolution》:Highly recurrent multi-nucleotide mutations in SARS-CoV-2

【字体: 时间:2025年10月25日 来源:Molecular Biology and Evolution 5.3

编辑推荐:

  本研究针对多核苷酸突变(MNMs)在SARS-CoV-2进化中的角色展开深入探索。通过对超过200万份公共基因组数据的分析,研究人员发现特定MNMs呈现高度复发性,且与病毒转录调控序列(TRS)密切相关。研究提出"中断模板转换"机制解释该现象,并证实未校正的MNMs会导致12%的重组推断假阳性。该发现深化了对冠状病毒进化机制的理解,并对病原体基因组分析工具开发具有重要指导意义。

  
在基因组进化研究领域,多核苷酸突变(MNMs)一直是个充满争议的话题。传统观点认为,这类同时改变多个相邻核苷酸的突变事件属于罕见且随机发生的现象。然而,这种认知在SARS-CoV-2海量基因组数据时代面临着全新挑战。随着COVID-19大流行的持续,全球科学家共享了数百万个病毒基因组序列,为在 unprecedented 尺度上研究病毒进化规律提供了宝贵机会。
以往研究表明,MNMs不仅对物种进化有重要贡献,还是人类疾病的致病因素之一,同时也会导致基因组数据分析中的错误注释、误诊以及其他偏差。尽管已有研究通过家系测序和突变积累系等方法证实了MNMs在不同物种中的存在,但其发生频率估计仅占核苷酸突变总数的0.4%到10%。更关键的是,现有生物信息学分析方法通常只考虑单核苷酸突变事件,这种简化处理可能带来一系列分析偏差。
为了解决这一重要问题,由欧洲分子生物学实验室(EMBL)De Maio领导的研究团队开展了一项大规模研究。他们利用精心整理的超过200万份SARS-CoV-2基因组数据集,通过先进的分析方法揭示了MNMs在病毒进化中的独特模式。这项发表在《Molecular Biology and Evolution》的研究不仅挑战了对MNMs的传统认知,还为理解冠状病毒进化机制提供了新的视角。
研究团队主要运用了几项关键技术方法:首先,他们利用Viridian工具对200多万个SARS-CoV-2基因组进行一致性序列 calling,有效避免了低测序深度区域的参考序列偏好;其次,通过MAPLE v0.6.8软件构建系统发育树,并使用UNREST替代模型、速率变异和深度SPR系统发育搜索进行优化;第三,开发了定制分析流程,通过"樱桃样本"(系统发育树中的兄弟样本对)的测序reads数据验证推定的MNMs事件;最后,利用RIVET软件分析MNMs对重组推断的影响。
2 结果
2.1 高度复发的单核苷酸突变组合
研究发现,SARS-CoV-2基因组中存在极端高度复发的单核苷酸突变,如G11083T(11,206次)和C21575T(6,913次)。这些突变的组合事件(如G11083T-C21575T出现53次)可通过随机共现解释。然而,表1中列出的其他mnSs(多核苷酸替代)比组成它们的单个核苷酸替代更为复发,且常涉及两个以上核苷酸替代。置换检验和超几何检验均证实,这些mnSs极不可能是独立单核苷酸突变事件的随机组合。
2.2 序列和比对误差
通过分析"樱桃样本"的测序reads数据,研究发现某些复发性mnSs与共识序列 calling 误差相关。例如,mnS1与测序深度突然下降区域相关,主要由不完全reads修剪引起;mnS2则富集在测序深度降低区域(28个樱桃样本中26个覆盖度<100×),是由预存在缺失和局部序列相似性导致的比对误差。
2.3 重组和污染
虽然同源重组和污染可能使mnSs在不同谱系间转移,但分析表明,这些因素并非复发性mnSs的主要驱动力量。复发性mnSs的流行度与单核苷酸替代相似,但前者显示出更高的替代次数。此外,mnSs与其反向突变的数量不对称性也进一步降低了重组和污染作为主要原因的可能性。
2.4 选择
研究表明,正选择或补偿性突变不太可能是复发性mnSs的主要成因。对仅涉及两个核苷酸替代且无indels的MNMs分析发现,其非同义替换比例与随机预期无显著差异,且这些MNMs具有与典型单核苷酸突变相似的选择压力模式。
2.5 MNMs的机制
研究提出了"中断模板转换"机制来解释大多数复发性MNMs。该机制与SARS-CoV-2已知的转录复制过程一致:RNA依赖的RNA聚合酶(RdRp)在TRS-B处暂停,转换至TRS-L,转录少量核苷酸后中断并返回原TRS-B继续转录,导致TRS-L附近序列被复制到TRS-B上游。13个MNMs(占个体出现次数的91%)与该机制相符,其中6个完美匹配(位于共识TRS motif的5'端1-5bp处),7个部分匹配。
2.6 复发性MNMs对重组推断的影响
研究发现,未校正的复发性MNMs会显著影响同源重组推断。在RIVET软件推断的13,204个重组事件中,1,579个(12%)完全由表1中的复发性MNMs支持,表明这些是MNMs导致的假阳性。特别是较大的MNMs(引起更多同时核苷酸替代)更容易产生显著的重组事件假阳性。
这项研究系统性地推翻了关于MNMs的传统认知,揭示了SARS-CoV-2中存在高度复发的MNMs,并提出了与转录调控过程相关的形成机制。这些发现不仅深化了对冠状病毒进化机制的理解,更重要的是警示了当前基因组分析工具在处理MNMs时存在的局限性。研究表明,忽略MNMs的存在会导致重组推断中出现12%的假阳性,同时也会影响正选择扫描和系统发育树重建的准确性。
从更广阔的视角来看,这项研究为理解病毒进化提供了新的范式。所有冠状病毒(以及其他尼多病毒)都具有与SARS-CoV-2相似的模板转换机制,因此它们的进化很可能同样受到复发性MNMs的影响。随着基因组数据产生和共享规模的不断扩大,未来我们将能够在更多病原体中识别和研究这类突变模式,进而优化基因组分析方法,提高病原体进化追踪和疾病防控的准确性。
研究还暗示,由中断模板转换机制引起的突变自然会增加受影响基因组区域与TRS-L序列的相似性,因此倾向于创建新的TRSs或使现有TRSs更接近共识TRS。这一发现对理解病毒转录调控网络的进化具有重要意义,表明某些TRS的趋同创建可能源于中性突变偏倚而非正选择。
这项研究充分展示了大规模基因组数据在解析微生物进化规律方面的强大能力,为未来病原体进化研究树立了新的标杆。随着测序技术的持续进步和数据共享文化的深入发展,我们有望在更多病原体系统中发现类似的进化规律,最终为传染病防控提供更加精准的进化理论基础。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号