编辑推荐:
为解决单克隆抗体(mAbs)研发耗时耗力的问题,研究人员开展利用 AI 模型预测抗流感 A 血凝素(HA)抗体活性的研究。结果显示模型在多种场景预测表现良好,这有助于加速流感研究和抗体设计,减少实验室测试成本。
在流感病毒肆虐的当下,流感 A 病毒给全球健康带来了巨大挑战。它每年在美国就影响约 2000 - 4000 万人,且由于其快速突变和动物宿主传播,在资源有限国家易引发严重疾病甚至死亡。单克隆抗体(mAbs)作为治疗多种疾病的有力武器,在流感防治方面也极具潜力,然而其研发过程漫长且成本高昂。传统的预测抗体与抗原结合活性的方法,如分子动力学(MD)和分子对接等,要么计算成本高,要么准确性欠佳。在这样的背景下,开发高效准确的预测模型迫在眉睫。
国外研究人员开展了一项旨在利用人工智能(AI)模型预测抗流感 A 血凝素(HA)抗体结合和受体阻断活性的研究。研究成果发表在《Computational and Structural Biotechnology Journal》上。该研究意义重大,有望变革抗体设计流程,减少对大量实验室测试的依赖,提高抗体研发效率,为流感防治提供新的思路和方法。
研究人员采用了多种关键技术方法。首先,利用 MAMMAL 框架下的 ibm/biomed.omics.bl.sm.ma-ted-458m 模型,该模型在大量多领域数据上进行过预训练。其次,通过五折交叉验证,在四种不同的数据分割策略(宽松、HA 专属、mAb 专属和 mAb 聚类专属)下评估模型的稳健性。最后,使用受试者工作特征曲线下面积(AUROC)和精确召回曲线下面积(AUPRC)来评估模型的分类性能。
研究结果
- 数据统计:分类数据集包含 188 种 mAbs 和 79 种 HAs,结合活性测定有 4922 对,HAI 测定有 5035 对,部分数据重叠。结合数据集中阳性对占 35%,HAI 数据集中占 11%。数据还涉及 mAb 宿主、HA 年份、亚型、mAb 轻链和重链的亚型及表位等信息,且对 mAbs 进行聚类分析。
- 结合活性和血凝抑制预测:通过八组五折交叉验证实验,对比随机初始化模型和 MAMMAL 微调模型。结果表明,MAMMAL 微调模型性能更优,在宽松和 HA 专属分割下表现更好,说明模型对未见 HA 序列的泛化能力强于未见 mAb 序列。
- 抗体保护广度预测:评估模型预测抗体对 H1 和 H3 亚型 HA 的保护广度的能力。计算预测分数与抗体阳性检测率的皮尔逊相关性和 AUROC,结果显示在不同亚型和检测类型下有一定的预测能力,尤其对 H3 亚型表现较好。
研究结论与讨论
研究人员利用 MAMMAL 框架开发并评估的 AI 模型,在预测抗体与流感 A HA 的结合和 HAI 活性方面展现出一定潜力。在宽松和 HA 专属分割条件下,模型预测性能高,可减少实验工作量和助力菌株监测。但在预测新抗体序列时存在局限性,尤其在面对差异较大的 HA 序列时。这可能是由于当前研究中数据集特征化 mAbs 稀缺。未来需通过扩展训练数据集,纳入更多 mAb 序列和其他生物数据来提升模型性能。同时,实验室验证对推进 AI 模型在新抗体 - HA 对的性能提升至关重要,也可为模型训练提供反馈。该研究为流感研究和抗体设计开辟了新方向,有望加速抗体研发进程,对全球健康事业具有重要意义。