SAAINT-DB：精准解析抗体-抗原互作的结构数据库助力抗体建模与设计新突破

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月01日 来源：Acta Pharmacologica Sinica 6.9

编辑推荐：

　　本研究针对现有抗体结构数据库在数据准确性、完整性和更新频率上的不足，开发了SAAINT-parser计算流程，构建了包含19,128条数据条目（来自9757个PDB结构）的SAAINT-DB数据库。该数据库通过精确识别抗体链配对和抗原结合界面（AAIs），提供比主流SAbDab更全面的非冗余抗体-抗原结合亲和力数据（1444条），为抗体工程和免疫治疗研发提供关键资源。

抗体（Antibody，Ab）作为免疫系统的核心效应分子，其与抗原（Antigen，Ag）的精准互作机制是药物研发的关键。尽管PDB数据库已收录23.5万条结构数据，但抗体相关结构仅占4%，且现有抗体数据库如SAbDab存在配对错误（如PDB 8d01中误判AL/HB为配对）、分类模糊（如Fab与Fv混用）和更新滞后等问题。这严重制约了人工智能（如AlphaFold）在抗体设计中的应用。

为解决这一瓶颈，密歇根大学医学院的研究团队开发了SAAINT-parser计算流程，通过三重模块（FASTA序列分析、mmCIF结构解析和网络数据抓取）实现抗体链的精准识别。该技术结合AbRSA抗体标记算法（准确率>95%）和UniDesign界面残基计算（N_{HL_inf_res}≥20），创新性地采用贪婪搜索与启发式迭代优化策略，成功纠正了SAbDab中60个PDB条目的错误配对（如正确识别2oqj的BA/ED/HG/KJ配对）。基于此构建的SAAINT-DB数据库包含19,128条数据，较SAbDab新增242个独特条目（如抗西加毒素Fab 2z93），并提供双倍的非冗余结合亲和力数据（pK_D值跨4-14数量级）。

关键方法

结构修复：采用Pulchra重建缺失原子，FASPR优化侧链堆积
抗体分类：基于序列长度（VH~110aa，FabH~220aa）和半径阈值（scFv≤20?）
抗原验证：要求界面含≥10个残基且CDR占比≥25%（R_{CDR_inf_res}≥0.25）

主要结果

数据库规模：涵盖1976-2025年间9757个PDB结构，64.2%为X射线衍射数据（中位分辨率2.4?）
抗体类型谱：明确区分29类抗体，包括9377个FabH:FabL、3643个VH:VL及1377个scFv（图2a）
互作特征：抗原界面残基（N_{Ab_Ag_inf_res}）30-60个，CDR占比超70%（图3c）
物种分布：人源抗体占主导（HCs中54.3%，LCs中61.8%）

讨论与意义
该研究通过结构完整性校验（TM-score≥0.4）排除了异常折叠体（如淀粉样纤维7nsl），并首次系统分类了嵌合抗体（如VH+含Cε2结构域）。相比SAbDab的22?半胱氨酸距离约束，SAAINT的界面残基指数评分（PS_HL=3N_{HL_inf_res}-?0.5(MI_{H_inf_res}+MI_{L_inf_res})?）更适应复杂场景。数据库已开源（GitHub/tommyhuangthu/SAAINT），为抗体人源化（如骆驼VHH改造）和COVID-19中和抗体设计提供关键结构模板。未来将扩展碳水化合物抗原支持，并开发可视化平台以弥补当前命令行交互的局限。该成果发表于《Acta Pharmacologica Sinica》，标志着抗体结构资源标准化的重要进展。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号