
-
生物通官微
陪你抓住生命科技
跳动的脉搏
TreeSort算法:揭示甲型流感病毒重配事件的高效进化分析工具
【字体: 大 中 小 】 时间:2025年08月09日 来源:Molecular Biology and Evolution 5.3
编辑推荐:
本研究针对甲型流感病毒(IAV)重配(reassortment)检测的算法瓶颈,开发了基于分子钟信号的TreeSort工具。研究人员通过构建参考基因系统发育树,结合统计假设检验,实现了在数千条全基因组数据中精准识别近期和祖先重配事件。该工具成功揭示了禽类H7亚型病毒重配率最高、H5N1高致病性禽流感表面蛋白共进化等重要发现,为实时追踪病毒进化提供了新方法。
流感病毒的"基因洗牌术"一直是科学家关注的焦点。甲型流感病毒(IAV)通过基因组8个片段的重配(reassortment)产生新组合,这种机制曾导致1957年H2N2、1968年H3N2和2009年H1N1pdm09三次流感大流行。然而,面对公共数据库中超过21万条全基因组数据,传统方法难以在保持精度的同时实现大规模分析,严重制约了对病毒进化规律的认知和疫情预警能力。
美国农业部农业研究局(USDA-ARS)国家动物疾病中心的Alexey Markin团队与奥克兰大学生物信息学研究所合作,在《Molecular Biology and Evolution》发表了突破性研究。他们开发的TreeSort算法创新性地利用选定基因片段(如HA)的系统发育树作为参考框架,通过统计检验判断其他基因片段是否偏离分子钟预期,从而准确定位重配分支。该工具不仅能识别重配事件,还能量化基因片段间的替换差异,例如PB2(136)表示新获得的PB2片段与祖先序列存在至少136个核苷酸差异。
研究采用多学科技术方法:1)基于GTR+Γ模型的系统发育树构建;2)分子钟速率估计;3)改良的Fitch小简约算法;4)泊松过程模型量化重配率。分析数据来自NCBI Virus数据库2010-2023年的禽类(H3/H5/H6/H7/H9)、猪(H1/H3)和人(H1/H3)IAV亚型全基因组,部分分析采用10,000条序列的随机子集。
【TreeSort Demonstrated High Accuracy in Reassortment Inference】
模拟数据显示,TreeSort在5,000条序列数据集上精确度达95%,召回率95%,运行时间呈线性增长。与CoalRe和TreeKnit相比,TreeSort在高重配率(ρ=0.5)和大数据集(5,000株)条件下保持80%准确率,显著优于其他工具。
【Avian IAV Had a Higher Reassortment Rate】
真实数据分析揭示:禽流感重配率(0.3-0.6事件/年/谱系)显著高于猪(0.1)和人(0.05)病毒。H7亚型重配最活跃(0.6),其次是H5(0.3)。值得注意的是,H5N1高致病性禽流感clade 2.3.4.4b在2020-2023年重配率升至0.72,远高于前期的0.44。
【Reassortment Patterns and Preferential Gene Pairings】
表面蛋白编码基因(HA/NA/MP)在多数亚型中呈现共进化特征,重配率最低。人类H1/H3病毒的HA-NA重配抑制尤为明显,而禽类H3/H6的HA-NA重配较自由。PB2基因重配频率最高,在H5N1和人流感中尤为突出。
【Changes in Reassortment Patterns of H5 Clade 2.3.4.4b】
2020年后全球传播的H5N1病毒表现出独特进化特征:PB2和NP基因重配活跃,但HA-NA-MP组合高度保守。与人类流感类似,这种表面蛋白的"锁定"现象可能反映高适应性病毒株的进化策略。
该研究建立的TreeSort工具首次实现了大规模IAV重配分析,其创新性体现在三个方面:1)突破计算瓶颈,使实时监测百万级基因组成为可能;2)发现禽类病毒重配率与宿主多样性正相关;3)揭示表面蛋白共进化是跨宿主传播病毒的共同特征。这些发现为预测潜在流行株提供了新指标——当检测到HA-NA-MP组合稳定且内部基因(PB2/NP)活跃重配的病毒时,需高度警惕其大流行潜力。研究公开的算法(https://github.com/flu-crew/TreeSort)已被用于追踪2024年美国奶牛H5N1疫情,成功识别出关键的重配基因B3.13型。
生物通微信公众号
知名企业招聘