DiffAD:基于扩散模型增强的流感病毒抗原距离预测框架及其在疫苗株筛选中的应用
【字体:
大
中
小
】
时间:2025年10月07日
来源:Exploratory Research in Clinical and Social Pharmacy 1.8
编辑推荐:
本刊推荐:本文针对流感病毒抗原性数据稀缺的挑战,创新性地提出DiffAD(基于扩散模型的数据增强框架),通过正向加噪和时间步感知反向去噪网络生成高保真HA特征向量,显著提升抗原距离预测精度(H1N1亚型MAE降至0.6402,R2达0.7412)。该研究为疫苗株筛选提供了高效计算工具,兼具生物合理性验证与跨亚型泛化能力。
基于HI滴度的抗原图谱(Antigenic Cartography)方法利用血清学数据将病毒株映射到低维空间,直观展示抗原关系与长期进化趋势。该领域由Lapedes和Farber开创(2001年),首次采用多维尺度分析(MDS)进行二维投影,后经Smith等人(2004年)优化投影算法提升精度。
本研究提出DiffAD创新框架,利用扩散模型(Ho等, 2020)解决流感抗原预测数据稀缺难题。如图1所示,DiffAD包含两大核心网络:(1)基于扩散的HA蛋白增强网络:学习HA序列与结构空间分布,生成高保真合成毒株以扩充训练集;(2)抗原距离预测模块:整合增强数据精准量化毒株间抗原差异。
我们通过整合多权威源数据,构建了1956年2月至2024年9月间的人源流感病毒抗原数据集。每条记录包含病毒-抗血清对的HI实验数据及传代历史、采集日期等元数据。最终数据集超50万条,覆盖A型流感(H3N2、H1N1)和B型流感(Victoria/Yamagata谱系)。
为系统评估框架各组件的贡献,我们采用Archetti-Horsfall距离在四个流感数据集上进行消融实验。重点测试了扩散增强网络、自注意力机制、距离预测模块的残差连接及RBS损失功能。图2结果显示:移除任一组件均导致性能下降,其中扩散增强网络的缺失对预测精度影响最为显著(H3N2数据集MAE上升0.21,R2降低0.18),证实了数据增强策略的核心价值。
高成本、低通量的HI实验仍是疫苗效力评估的主要瓶颈。本研究提出的DiffAD框架通过扩散模型生成具有生物意义的HA特征,有效缓解了流感监测中的数据稀缺问题。大量实验证明该方法在抗原距离预测任务中显著优于现有方案(SLT度量下H1N1的R2提升至0.7412),且生成毒株与原始抗原簇高度吻合,为疫苗株筛选提供了可靠的计算生物学工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号