
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于AI进化与抗原性模型的流感疫苗株选择新策略:VaxSeer系统提升疫苗匹配精准度
【字体: 大 中 小 】 时间:2025年08月29日 来源:Nature Medicine 50
编辑推荐:
本研究针对流感疫苗有效性持续低于40%的难题,开发了AI驱动的VaxSeer系统。通过整合HA蛋白序列的进化预测(dominance predictor)和抗原性分析(antigenicity predictor),构建覆盖分数(coverage score)模型,在10年回溯性验证中显著优于WHO推荐株选择。该系统与CDC疫苗有效性数据显著相关(Pearson r=0.861),为疫苗株筛选提供了计算生物学新范式。
流感病毒每年导致的全球公共卫生负担高达300-500万重症病例,而现有疫苗平均有效性不足40%。这一困境的核心在于病毒HA蛋白的快速抗原漂移(antigenic drift)与疫苗生产周期存在6-9个月的时间差。传统WHO专家会议基于有限HI(hemagglutination inhibition)数据和病毒监测的推荐方式,难以准确预测未来流行株的抗原特征。2014-2015年北半球流感季中,疫苗株与流行株的错配更导致有效性骤降至6%,凸显现有决策体系的局限性。
Wenxian Shi团队在《Nature Medicine》发表的这项研究,开创性地将深度学习与病毒进化动力学相结合。研究者从GISAID数据库获取394,090条HA蛋白序列,整合WHO合作中心(Francis Crick Institute)2003-2023年的HI测试数据,构建了双轨预测系统:基于Transformer语言模型和常微分方程(ODE)的dominance predictor动态模拟病毒株优势度演变;采用MSA Transformer架构的antigenicity predictor则通过疫苗-病毒HA蛋白对齐预测HI值。两者协同生成的覆盖分数(coverage score)量化了疫苗株对未来流行株的抗原覆盖广度。
关键技术方法
数据构建:从GISAID获取28,546条A/H3N2和23,736条A/H1N1的HA全长序列,时间跨度为2003-2023年;HI测试数据涵盖70,631对A/H1N1和63,299对A/H3N2疫苗-病毒组合
动态优势度预测:12层GPT-2模型参数化ODE方程,模拟病毒株频率随时间变化
抗原性预测:12层MSA Transformer处理疫苗-病毒HA序列对,回归预测HI值
有效性验证:采用CDC、I-MOVE和SPSN三大洲10年疫苗有效性临床数据
主要研究结果
疫苗选择基于预测覆盖分数
在2012-2021年的回溯性验证中,VaxSeer推荐株的实证覆盖分数(empirical coverage score)在A/H3N2亚型9/10年份、A/H1N1亚型6/10年份超越WHO推荐株(P=4.1×10-5)。2019年北半球流行季中,WHO推荐株仅覆盖新兴支系3C.3a1,而VaxSeer选择株能同时覆盖主导支系3C.2a1b.1a/b和3C.2a1b.2b/a。

预测覆盖分数与疫苗有效性相关
覆盖分数与CDC疫苗有效性显著相关(Spearman ρ=0.891,P<0.001),能区分高有效性(≥40%)和低有效性疫苗(P=0.026)。在疾病负担方面,覆盖分数与CDC估计的美国门诊量减少数呈正相关(r=0.699)。
优势度预测器性能
相比静态适应度景观模型(CSCS、EVEscape),动态ODE模型的实证覆盖分数预测误差降低23.7%(MAE=0.217 vs 0.285),对top20%优势株的识别准确率提升2.1倍。
讨论与意义
该研究突破了传统疫苗株选择的两大瓶颈:通过语言模型捕捉HA蛋白全序列的协同进化特征,解决了单突变叠加模型的局限性;建立HI值的计算预测体系,将抗原性验证范围从<10株/年扩展至全部候选株。虽然未考虑宿主免疫史、佐剂等因素,但覆盖分数仍与临床终点显著相关,证实抗原匹配是疫苗有效性的核心决定因素。
未来可通过整合神经氨酸酶(neuraminidase)数据、引入糖基化修饰预测进一步提升模型精度。当前系统已具备实际应用价值:在2023-2024流感季中,VaxSeer提前1年成功预测到Michigan/45/2015株的高效性,该株后被WHO采纳为推荐株。这项研究为RNA病毒疫苗开发提供了可推广的计算框架,对应对新冠病毒(SARS-CoV-2)等快速变异病原体具有重要启示。
生物通微信公众号
知名企业招聘