SAAINT-DB:精准解析抗体-抗原互作的结构数据库助力抗体建模与设计新突破

【字体: 时间:2025年07月01日 来源:Acta Pharmacologica Sinica 6.9

编辑推荐:

  本研究针对现有抗体结构数据库在数据准确性、完整性和更新频率上的不足,开发了SAAINT-parser计算流程,构建了包含19,128条数据条目(来自9757个PDB结构)的SAAINT-DB数据库。该数据库通过精确识别抗体链配对和抗原结合界面(AAIs),提供比主流SAbDab更全面的非冗余抗体-抗原结合亲和力数据(1444条),为抗体工程和免疫治疗研发提供关键资源。

  

抗体(Antibody,Ab)作为免疫系统的核心效应分子,其与抗原(Antigen,Ag)的精准互作机制是药物研发的关键。尽管PDB数据库已收录23.5万条结构数据,但抗体相关结构仅占4%,且现有抗体数据库如SAbDab存在配对错误(如PDB 8d01中误判AL/HB为配对)、分类模糊(如Fab与Fv混用)和更新滞后等问题。这严重制约了人工智能(如AlphaFold)在抗体设计中的应用。

为解决这一瓶颈,密歇根大学医学院的研究团队开发了SAAINT-parser计算流程,通过三重模块(FASTA序列分析、mmCIF结构解析和网络数据抓取)实现抗体链的精准识别。该技术结合AbRSA抗体标记算法(准确率>95%)和UniDesign界面残基计算(NHL_inf_res≥20),创新性地采用贪婪搜索与启发式迭代优化策略,成功纠正了SAbDab中60个PDB条目的错误配对(如正确识别2oqj的BA/ED/HG/KJ配对)。基于此构建的SAAINT-DB数据库包含19,128条数据,较SAbDab新增242个独特条目(如抗西加毒素Fab 2z93),并提供双倍的非冗余结合亲和力数据(pKD值跨4-14数量级)。

关键方法

  1. 结构修复:采用Pulchra重建缺失原子,FASPR优化侧链堆积
  2. 抗体分类:基于序列长度(VH~110aa,FabH~220aa)和半径阈值(scFv≤20?)
  3. 抗原验证:要求界面含≥10个残基且CDR占比≥25%(RCDR_inf_res≥0.25)

主要结果

  1. 数据库规模:涵盖1976-2025年间9757个PDB结构,64.2%为X射线衍射数据(中位分辨率2.4?)
  2. 抗体类型谱:明确区分29类抗体,包括9377个FabH:FabL、3643个VH:VL及1377个scFv(图2a)
  3. 互作特征:抗原界面残基(NAb_Ag_inf_res)30-60个,CDR占比超70%(图3c)
  4. 物种分布:人源抗体占主导(HCs中54.3%,LCs中61.8%)

讨论与意义
该研究通过结构完整性校验(TM-score≥0.4)排除了异常折叠体(如淀粉样纤维7nsl),并首次系统分类了嵌合抗体(如VH+含Cε2结构域)。相比SAbDab的22?半胱氨酸距离约束,SAAINT的界面残基指数评分(PSHL=3NHL_inf_res-?0.5(MIH_inf_res+MIL_inf_res)?)更适应复杂场景。数据库已开源(GitHub/tommyhuangthu/SAAINT),为抗体人源化(如骆驼VHH改造)和COVID-19中和抗体设计提供关键结构模板。未来将扩展碳水化合物抗原支持,并开发可视化平台以弥补当前命令行交互的局限。该成果发表于《Acta Pharmacologica Sinica》,标志着抗体结构资源标准化的重要进展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号