
-
生物通官微
陪你抓住生命科技
跳动的脉搏
AlphaBind:基于深度学习的抗体-抗原结合亲和力预测与优化领域专用模型
【字体: 大 中 小 】 时间:2025年08月06日 来源:mAbs 7.3
编辑推荐:
这篇综述介绍了AlphaBind这一领域专用模型,其通过蛋白质语言模型(ESM-2nv)嵌入和750万组抗体-抗原结合强度实验数据预训练,实现了抗体亲和力优化的突破性进展。研究证明,该模型仅需单轮数据生成即可指导多突变(最高11个)抗体的优化,显著提升结合亲和力(最高74倍),同时兼顾可开发性(developability)和免疫原性(immunogenicity)预测,为抗体工程(antibody engineering)提供了高效计算工具。
AlphaBind作为领域专用模型,通过整合蛋白质语言模型(ESM-2nv)嵌入和大规模实验室定量数据(750万组抗体-抗原结合强度测量),实现了抗体亲和力优化的革命性突破。该模型在四种亲本抗体(包括已亲和成熟的抗体)的优化中表现出色,仅需单轮数据生成即可产生多达11个突变的候选序列,同时维持结构稳定性和其他生物物理特性。研究团队公开了模型权重和代码,推动抗体药物开发的标准化进程。
治疗性抗体凭借其高特异性和多样性,已成为生物医药市场的核心。然而,传统抗体优化依赖定向进化或动物免疫,效率低下且成本高昂。AlphaBind通过深度学习解析序列-功能关系,利用酵母展示系统(AlphaSeq)生成的高通量亲和力数据(如SARS-CoV-2 RBD靶点库),结合预训练策略,显著提升了抗体设计的精准度。
研究选取了三种抗体进行验证:
AAB-PP489:靶向人TIGIT的人源化scFv,通过AlphaBind优化后亲和力提升74倍(KinExA验证,从56.5 pM至766 fM)。
VHH72:靶向SARS-CoV-1/2 RBD的骆驼单域抗体,优化后亲和力提升14倍(BLI验证,16.8 nM至1.17 nM)。
Pembrolizumab-scFv:抗PD-1抗体,所有候选序列均显示亲和力提升。
AlphaBind采用ESM-2nv嵌入抗体和靶标序列,通过7层Transformer编码器(15M参数)预测亲和力。预训练数据覆盖20个数据集,包括VHH和scFv抗体,确保模型泛化能力。
以AAB-PP489为例,AlphaBind在去除CDRH3的异构化(DS)和断裂(DP)风险基序的同时,将4/9位点回复至人种系序列,最终获得表达量提升29%、亲和力达310 fM的优化变体(AAB-PP3117)。
使用外部哺乳动物展示数据(Trastuzumab-scFv CDRH3突变库)微调AlphaBind后,60%候选序列成功结合HER2,其中最佳变体亲和力提升2.8倍(KinExA验证,7.43 pM至2.74 pM),证实模型对非AlphaSeq数据的适应性。
AlphaBind在多项指标上超越现有方法:
成功率:100% BLI验证候选序列(10/10)显示亲和力提升,优于同类研究的40-90%。
序列多样性:突变覆盖CDR和框架区(FR),如VHH72的CDRH1/H2和FR3高频突变,为多目标优化提供空间。
局限性:零样本预测能力较弱,需依赖特定抗体系统的微调数据。
未来方向包括整合结构数据扩展模型通用性,以及探索GPCR抗体等复杂靶点的优化策略。AlphaBind的开源化将加速生物药研发从“试错式”向“计算驱动”范式转变。
数据生成:AlphaSeq通过酵母展示和纳米孔测序(Oxford Nanopore)定量30,000个抗体变体的亲和力。
模型训练:预训练使用8块H100 GPU(AWS p5.48xlarge),单抗体微调成本约200美元。
优化策略:ESM-2nv掩码采样生成候选序列,结合TAP(Therapeutic Antibody Profiler)过滤可开发性风险。
生物通微信公众号
知名企业招聘