AlphaBind：基于深度学习的抗体-抗原结合亲和力预测与优化领域专用模型

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月06日 来源：mAbs 7.3

编辑推荐：

　　这篇综述介绍了AlphaBind这一领域专用模型，其通过蛋白质语言模型（ESM-2nv）嵌入和750万组抗体-抗原结合强度实验数据预训练，实现了抗体亲和力优化的突破性进展。研究证明，该模型仅需单轮数据生成即可指导多突变（最高11个）抗体的优化，显著提升结合亲和力（最高74倍），同时兼顾可开发性（developability）和免疫原性（immunogenicity）预测，为抗体工程（antibody engineering）提供了高效计算工具。

摘要

AlphaBind作为领域专用模型，通过整合蛋白质语言模型（ESM-2nv）嵌入和大规模实验室定量数据（750万组抗体-抗原结合强度测量），实现了抗体亲和力优化的革命性突破。该模型在四种亲本抗体（包括已亲和成熟的抗体）的优化中表现出色，仅需单轮数据生成即可产生多达11个突变的候选序列，同时维持结构稳定性和其他生物物理特性。研究团队公开了模型权重和代码，推动抗体药物开发的标准化进程。

引言

治疗性抗体凭借其高特异性和多样性，已成为生物医药市场的核心。然而，传统抗体优化依赖定向进化或动物免疫，效率低下且成本高昂。AlphaBind通过深度学习解析序列-功能关系，利用酵母展示系统（AlphaSeq）生成的高通量亲和力数据（如SARS-CoV-2 RBD靶点库），结合预训练策略，显著提升了抗体设计的精准度。

结果

抗体优化案例

研究选取了三种抗体进行验证：

AAB-PP489：靶向人TIGIT的人源化scFv，通过AlphaBind优化后亲和力提升74倍（KinExA验证，从56.5 pM至766 fM）。
VHH72：靶向SARS-CoV-1/2 RBD的骆驼单域抗体，优化后亲和力提升14倍（BLI验证，16.8 nM至1.17 nM）。
Pembrolizumab-scFv：抗PD-1抗体，所有候选序列均显示亲和力提升。

模型架构

AlphaBind采用ESM-2nv嵌入抗体和靶标序列，通过7层Transformer编码器（15M参数）预测亲和力。预训练数据覆盖20个数据集，包括VHH和scFv抗体，确保模型泛化能力。

可开发性工程

以AAB-PP489为例，AlphaBind在去除CDRH3的异构化（DS）和断裂（DP）风险基序的同时，将4/9位点回复至人种系序列，最终获得表达量提升29%、亲和力达310 fM的优化变体（AAB-PP3117）。

跨平台验证

使用外部哺乳动物展示数据（Trastuzumab-scFv CDRH3突变库）微调AlphaBind后，60%候选序列成功结合HER2，其中最佳变体亲和力提升2.8倍（KinExA验证，7.43 pM至2.74 pM），证实模型对非AlphaSeq数据的适应性。

讨论

AlphaBind在多项指标上超越现有方法：

成功率：100% BLI验证候选序列（10/10）显示亲和力提升，优于同类研究的40-90%。
序列多样性：突变覆盖CDR和框架区（FR），如VHH72的CDRH1/H2和FR3高频突变，为多目标优化提供空间。
局限性：零样本预测能力较弱，需依赖特定抗体系统的微调数据。

未来方向包括整合结构数据扩展模型通用性，以及探索GPCR抗体等复杂靶点的优化策略。AlphaBind的开源化将加速生物药研发从“试错式”向“计算驱动”范式转变。

材料与方法

数据生成：AlphaSeq通过酵母展示和纳米孔测序（Oxford Nanopore）定量30,000个抗体变体的亲和力。
模型训练：预训练使用8块H100 GPU（AWS p5.48xlarge），单抗体微调成本约200美元。
优化策略：ESM-2nv掩码采样生成候选序列，结合TAP（Therapeutic Antibody Profiler）过滤可开发性风险。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号