
-
生物通官微
陪你抓住生命科技
跳动的脉搏
双链DNA病毒中新型病毒组蛋白的宏基因组挖掘揭示其结构多样性与功能可塑性
【字体: 大 中 小 】 时间:2025年06月05日 来源:hLife
编辑推荐:
本研究通过宏基因组学方法系统挖掘了dsDNA病毒中编码的组蛋白(histones)和组蛋白折叠蛋白(HFPs),在Caudoviricetes类病毒中首次发现1500余种新型病毒组蛋白。通过AlphaFold3结构预测和体外实验证实H2B-H2A-H3三联体与H4单体能形成核小体样颗粒(NLPs),并鉴定出6类功能各异的HFPs。该研究拓展了病毒组蛋白的结构与功能认知,为理解病毒-宿主互作及染色质进化提供了新视角。
病毒世界的"染色质建筑师":解码双链DNA病毒中的组蛋白密码
在生命演化的长河中,组蛋白(histones)曾被认为是真核生物独有的"分子雕塑家",它们将DNA缠绕成核小体,构建起染色质的立体结构。然而近年来,古菌和细菌中组蛋白同源物的发现打破了这一认知边界。更令人惊讶的是,某些双链DNA(dsDNA)病毒竟也携带着真核生物样组蛋白,这些"分子间谍"可能通过调控宿主染色质帮助病毒完成感染周期。但病毒组蛋白的分布广度、结构变异和功能多样性仍是未解之谜,阻碍着人们对病毒-宿主共进化机制的理解。
为解决这一科学难题,国内研究团队在《hLife》发表了突破性研究。研究人员采用宏基因组挖掘结合人工智能预测技术,系统分析了IMG/VR 4数据库中557万条高质量病毒基因组。通过Hidden Markov Model(HMM)谱系分析鉴定了1505个病毒组蛋白,利用AlphaFold2/3进行三维结构预测和功能注释,并通过体外重组实验验证关键发现。特别关注了Caudoviricetes(主要感染细菌/古菌的尾状噬菌体类)和Megaviricetes(核质巨DNA病毒类)两类病毒。
病毒组蛋白的宏基因组图谱
通过HMM模型在病毒基因组中鉴定出966个组蛋白,主要分布于Megaviricetes和Caudoviricetes类病毒。序列和结构聚类显示,Caudoviricetes中84个细菌样组蛋白折叠蛋白(HFPs)属首次报道,其宿主预测与Pseudomonadota(细菌)和Methanobacteriota(古菌)相符,暗示水平基因转移事件。长度分布分析发现两个峰值(约165和380氨基酸),后者对应组蛋白多联体(multiplet),包括三联体H2B-H2A-H3和四联体H4-H3-H2B-H2A等新型变体。
核小体样颗粒的组装机制
AlphaFold3预测显示,共现于同一病毒基因组的H2B-H2A-H3三联体与H4单体可与Widom 601 DNA形成类核小体结构。体外实验证实,来自Caudoviricetes和Megaviricetes的代表性组蛋白能组装成分子量约100 kDa的复合物,电泳迁移实验显示其与DNA形成两种迁移速率的复合物,暗示动态组装过程。这些病毒核小体样颗粒(NLPs)的凝胶迁移率低于真核核小体,提示其结构松散性可能为病毒特异性调控留下空间。
组蛋白折叠蛋白的功能分型
结构聚类揭示7类病毒HFPs,包括6种新型变体:
染色质相关蛋白的协同进化
在Megaviricetes中,组蛋白存在与染色质相关蛋白(CRPs)显著正相关(GLM模型效应值0.45,P<3.95×10?10
),特别是含SNF2染色质重塑域(效应值1.37,P<5.32×10?16
)、BET阅读器域和BRCT域的蛋白。这种特异性关联暗示病毒可能通过CRPs调控染色质动态,而Caudoviricetes中缺乏此现象,反映其组蛋白功能分化。
这项研究重塑了人们对病毒组蛋白的认知框架:首先,Caudoviricetes中细菌/古菌样HFPs的发现扩展了组蛋白进化树;其次,真核样组蛋白在噬菌体中的存在暗示跨域基因交流的复杂性;最后,六类新型HFPs的鉴定为DNA包装和基因调控机制研究提供了新靶点。尤为重要的是,组蛋白与CRPs的协同出现模式提示病毒可能已发展出独立的染色质调控网络,这为理解大DNA病毒的感染策略开辟了新视角。未来对VKHFP等特殊变体的功能解析,或将揭示RNA-染色质互作等前所未有的调控维度。
该研究通过计算预测与实验验证的闭环研究策略,展现了宏基因组学与人工智能在发现生命暗物质中的强大合力。正如研究者所言,这些病毒"分子乐高"的多样性,正在重新定义我们对染色质进化与病毒适应性的理解边界。
生物通微信公众号
知名企业招聘