AlphaBind:基于深度学习的抗体-抗原结合亲和力预测与优化领域专用模型

【字体: 时间:2025年08月06日 来源:mAbs 7.3

编辑推荐:

  这篇综述介绍了AlphaBind这一领域专用模型,其通过蛋白质语言模型(ESM-2nv)嵌入和750万组抗体-抗原结合强度实验数据预训练,实现了抗体亲和力优化的突破性进展。研究证明,该模型仅需单轮数据生成即可指导多突变(最高11个)抗体的优化,显著提升结合亲和力(最高74倍),同时兼顾可开发性(developability)和免疫原性(immunogenicity)预测,为抗体工程(antibody engineering)提供了高效计算工具。

  

摘要

AlphaBind作为领域专用模型,通过整合蛋白质语言模型(ESM-2nv)嵌入和大规模实验室定量数据(750万组抗体-抗原结合强度测量),实现了抗体亲和力优化的革命性突破。该模型在四种亲本抗体(包括已亲和成熟的抗体)的优化中表现出色,仅需单轮数据生成即可产生多达11个突变的候选序列,同时维持结构稳定性和其他生物物理特性。研究团队公开了模型权重和代码,推动抗体药物开发的标准化进程。

引言

治疗性抗体凭借其高特异性和多样性,已成为生物医药市场的核心。然而,传统抗体优化依赖定向进化或动物免疫,效率低下且成本高昂。AlphaBind通过深度学习解析序列-功能关系,利用酵母展示系统(AlphaSeq)生成的高通量亲和力数据(如SARS-CoV-2 RBD靶点库),结合预训练策略,显著提升了抗体设计的精准度。

结果

抗体优化案例

研究选取了三种抗体进行验证:

  1. AAB-PP489:靶向人TIGIT的人源化scFv,通过AlphaBind优化后亲和力提升74倍(KinExA验证,从56.5 pM至766 fM)。

  2. VHH72:靶向SARS-CoV-1/2 RBD的骆驼单域抗体,优化后亲和力提升14倍(BLI验证,16.8 nM至1.17 nM)。

  3. Pembrolizumab-scFv:抗PD-1抗体,所有候选序列均显示亲和力提升。

模型架构

AlphaBind采用ESM-2nv嵌入抗体和靶标序列,通过7层Transformer编码器(15M参数)预测亲和力。预训练数据覆盖20个数据集,包括VHH和scFv抗体,确保模型泛化能力。

可开发性工程

以AAB-PP489为例,AlphaBind在去除CDRH3的异构化(DS)和断裂(DP)风险基序的同时,将4/9位点回复至人种系序列,最终获得表达量提升29%、亲和力达310 fM的优化变体(AAB-PP3117)。

跨平台验证

使用外部哺乳动物展示数据(Trastuzumab-scFv CDRH3突变库)微调AlphaBind后,60%候选序列成功结合HER2,其中最佳变体亲和力提升2.8倍(KinExA验证,7.43 pM至2.74 pM),证实模型对非AlphaSeq数据的适应性。

讨论

AlphaBind在多项指标上超越现有方法:

  • 成功率:100% BLI验证候选序列(10/10)显示亲和力提升,优于同类研究的40-90%。

  • 序列多样性:突变覆盖CDR和框架区(FR),如VHH72的CDRH1/H2和FR3高频突变,为多目标优化提供空间。

  • 局限性:零样本预测能力较弱,需依赖特定抗体系统的微调数据。

未来方向包括整合结构数据扩展模型通用性,以及探索GPCR抗体等复杂靶点的优化策略。AlphaBind的开源化将加速生物药研发从“试错式”向“计算驱动”范式转变。

材料与方法

  • 数据生成:AlphaSeq通过酵母展示和纳米孔测序(Oxford Nanopore)定量30,000个抗体变体的亲和力。

  • 模型训练:预训练使用8块H100 GPU(AWS p5.48xlarge),单抗体微调成本约200美元。

  • 优化策略:ESM-2nv掩码采样生成候选序列,结合TAP(Therapeutic Antibody Profiler)过滤可开发性风险。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号