自然环境中CRISPR-Cas系统从外源原核基因组获取间隔序列的机制与生态意义
《Genome Biology and Evolution》:Acquisition of Spacers from Foreign Prokaryotic Genomes by CRISPR-Cas Systems in Natural Environments
【字体:
大
中
小
】
时间:2025年11月14日
来源:Genome Biology and Evolution 2.8
编辑推荐:
本研究针对自然微生物群落中CRISPR间隔序列来源不明的难题,通过分析地下环境宏基因组组装基因组(MAGs),首次揭示CRISPR-Cas系统可大量获取同环境中其他原核生物的DNA作为间隔序列,其数量可达自身靶向间隔子的3倍。该发现为公共数据库中未匹配间隔序列的来源提供了新解释,深化了对CRISPR系统多样性及其生态功能的理解。
在微生物的世界里,病毒和可移动遗传元件(MGEs)如同隐形刺客,时刻威胁着细菌与古菌的生存。为了抵御这些入侵者,原核生物演化出了CRISPR-Cas系统——一种精准的适应性免疫机制。当遭遇病毒或质粒攻击时,CRISPR-Cas系统会捕获入侵者DNA的特定片段(称为原型间隔子),并将其整合到宿主基因组的CRISPR阵列中,形成新的间隔序列。这些间隔序列随后被转录成crRNA,指导Cas蛋白识别并切割携带对应原型间隔子的外来核酸,实现免疫防御。
然而,尽管CRISPR-Cas系统在约85%的古菌和40%的细菌中存在,对公共基因组数据的分析显示,仅有平均7%的间隔序列能匹配到已知的MGEs来源的原型间隔子。绝大多数间隔序列的起源成谜,如同微生物世界的“暗物质”。以往研究曾提出少数可能机制:例如,宿主可能偶然获取靶向自身基因组的“自我靶向”间隔子,用于调控基因表达或抑制重组;或通过“误伤”机制,从未能成功感染但注入DNA的病毒中获取间隔子。近期对地下古菌Ca. Altiarchaeum的研究还发现,其CRISPR系统可针对共生DPANN古菌的基因组获取数百个间隔子,以抵抗寄生。但这些案例仅能解释极少数间隔序列的多样性,自然环境中CRISPR间隔序列的庞大库存仍缺乏合理解释。
为破解这一谜题,Sures等人在《Genome Biology and Evolution》发表研究,聚焦深部生物圈(如热液沉积物和高CO2含水层),分析了超过1 Tb的宏基因组数据,构建了千余个宏基因组组装基因组(MAGs),并系统挖掘了其中的CRISPR-Cas系统。他们提出一个大胆假设:CRISPR间隔序列可能来源于同一环境中其他原核生物的基因组,而非仅限病毒或自身DNA。
研究选取瓜伊马斯盆地(GB)热液沉积物和瓦伦博恩(WB)高CO2含水层两类地下环境,利用宏基因组测序数据组装生成810个(GB)和726个(WB)中高质量MAGs。通过dRep去冗余后,获得515个(GB)和90个(WB)MAG集群。采用CRISPRCasFinder识别CRISPR阵列(证据等级4),并经CD-HIT聚类间隔序列(97%相似度)以去重。为精准匹配间隔子与原型间隔子,研究屏蔽了MAGs中的CRISPR阵列和病毒支架(使用VirSorter2、VIBRANT和CheckV工具),并排除原噬菌体邻近区域,最终以80%相似度阈值鉴定间隔子-原型间隔子对。此外,通过MetaCRAST从宏基因组读长中直接提取间隔序列,验证MAGs分析结果的可靠性。
1. 外源原核基因组是CRISPR间隔序列的重要来源
在GB和WB的MAGs中,分别有42%和40%的含CRISPR-Cas系统的MAG集群携带靶向同环境中其他原核基因组的间隔序列。这些“原核生物靶向间隔序列”占所有间隔序列多样性的约3%,但其数量最高可达自我靶向间隔序列的3倍。系统发育分析显示,靶向关系跨越了8个古菌门和15个细菌门,表明这一现象在微生物界广泛存在。
为探究细菌获取外源DNA的机制,研究分析了与自然转化(如IV型菌毛蛋白PilA/PilT)、细胞外核酸酶相关的基因。结果发现,虽所有携带原核靶向间隔序列的MAG集群均编码这些蛋白,但其丰度与无此类间隔序列的MAG集群无显著差异。这表明间隔序列的获取可能并非由特异的DNA摄取机制驱动,而是环境核酸物质摄入的“副产品”。
3. 原型间隔子宿主丰度与CRISPR阵列数量影响间隔序列获取
相关性分析显示,原型间隔子所属MAG集群的相对丰度与靶向它的间隔序列数量呈弱正相关(GB: R=0.13, P<0.001;WB: R=0.081, P<0.001)。此外,携带原核靶向间隔序列的MAG集群其CRISPR阵列数量和总间隔序列数均显著偏高(如WB中阵列数与靶向间隔子数相关系数R=0.54, P=0.005),表明CRISPR系统的复杂度提升了获取外源间隔序列的概率。
4. 多类CRISPR-Cas亚型参与外源间隔序列获取
CRISPRCasTyper分型显示,原核靶向间隔序列分布于12种CRISPR-Cas亚型(如I-C、I-F、III-A等),且在GB的I-C亚型和WB的I-F、II-C等亚型中显著富集。相反,I-E亚型在两个环境中均显著缺乏此类间隔序列。亚型偏好性存在环境差异,提示CRISPR系统的功能分化可能与生态位适应相关。
本研究首次在自然环境中证实:CRISPR-Cas系统可大量获取同栖息地其他原核生物的DNA作为间隔序列,这一现象对解释公共数据库中“未匹配”间隔序列的起源具有重要意义。尽管其生物学功能尚不明确(可能为营养摄入或HGT的副产物),但研究揭示了微生物群落中核酸物质流动与免疫系统进化的复杂互作。该发现拓展了对CRISPR系统生态功能的认知,为理解微生物种间互作、环境适应及基因组稳定性提供了新视角。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号