
-
生物通官微
陪你抓住生命科技
跳动的脉搏
SAAINT-DB:精准解析抗体-抗原互作的结构数据库助力抗体建模与设计新突破
【字体: 大 中 小 】 时间:2025年07月01日 来源:Acta Pharmacologica Sinica 6.9
编辑推荐:
本研究针对现有抗体结构数据库在数据准确性、完整性和更新频率上的不足,开发了SAAINT-parser计算流程,构建了包含19,128条数据条目(来自9757个PDB结构)的SAAINT-DB数据库。该数据库通过精确识别抗体链配对和抗原结合界面(AAIs),提供比主流SAbDab更全面的非冗余抗体-抗原结合亲和力数据(1444条),为抗体工程和免疫治疗研发提供关键资源。
抗体(Antibody,Ab)作为免疫系统的核心效应分子,其与抗原(Antigen,Ag)的精准互作机制是药物研发的关键。尽管PDB数据库已收录23.5万条结构数据,但抗体相关结构仅占4%,且现有抗体数据库如SAbDab存在配对错误(如PDB 8d01中误判AL/HB为配对)、分类模糊(如Fab与Fv混用)和更新滞后等问题。这严重制约了人工智能(如AlphaFold)在抗体设计中的应用。
为解决这一瓶颈,密歇根大学医学院的研究团队开发了SAAINT-parser计算流程,通过三重模块(FASTA序列分析、mmCIF结构解析和网络数据抓取)实现抗体链的精准识别。该技术结合AbRSA抗体标记算法(准确率>95%)和UniDesign界面残基计算(NHL_inf_res≥20),创新性地采用贪婪搜索与启发式迭代优化策略,成功纠正了SAbDab中60个PDB条目的错误配对(如正确识别2oqj的BA/ED/HG/KJ配对)。基于此构建的SAAINT-DB数据库包含19,128条数据,较SAbDab新增242个独特条目(如抗西加毒素Fab 2z93),并提供双倍的非冗余结合亲和力数据(pKD值跨4-14数量级)。
关键方法
主要结果
讨论与意义
该研究通过结构完整性校验(TM-score≥0.4)排除了异常折叠体(如淀粉样纤维7nsl),并首次系统分类了嵌合抗体(如VH+含Cε2结构域)。相比SAbDab的22?半胱氨酸距离约束,SAAINT的界面残基指数评分(PSHL=3NHL_inf_res-?0.5(MIH_inf_res+MIL_inf_res)?)更适应复杂场景。数据库已开源(GitHub/tommyhuangthu/SAAINT),为抗体人源化(如骆驼VHH改造)和COVID-19中和抗体设计提供关键结构模板。未来将扩展碳水化合物抗原支持,并开发可视化平台以弥补当前命令行交互的局限。该成果发表于《Acta Pharmacologica Sinica》,标志着抗体结构资源标准化的重要进展。
生物通微信公众号
知名企业招聘