
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于大规模天然配对抗体序列与结构数据揭示重链/轻链保守接触位点与种系偏好性
【字体: 大 中 小 】 时间:2025年07月28日 来源:Communications Biology 5.2
编辑推荐:
本研究针对抗体工程中重链(VH)与轻链(VL)配对机制不明确的问题,通过构建包含5800万条配对抗体序列的PairedAbNGS数据库,结合RCSB结构数据分析,揭示了种系基因(IGHV/IGLV)非随机配对模式及CDR3-FWR2界面关键接触残基。研究发现受体编辑(receptor editing)偏好低自反应性组合,且单抗开发中过度依赖κ轻链(IGKC)可能限制治疗潜力,为优化生物药设计提供了重要理论依据。
在生物医药领域,治疗性抗体已成为增长最快的药物类别,年获批数量已与小分子药物持平。然而抗体开发仍面临重大挑战:实验方法如杂交瘤技术耗时昂贵,且对膜蛋白等"难处理"靶点效果不佳;计算设计又受限于配对抗体序列数据的匮乏——现有数据库仅覆盖预估抗体多样性的极小部分。更关键的是,重链与轻链如何特异性配对形成功能性抗体的分子机制尚不明确,这直接影响了抗体药物的开发效率与成功率。
针对这些核心问题,来自波兰华沙大学(University of Warsaw)的研究团队开展了大规模配对抗体序列与结构分析研究。他们通过创新性地整合5800万条单细胞测序数据与结构生物学信息,创建了目前最大的天然配对抗体数据库PairedAbNGS,并揭示了决定抗体组装的关键规律。这项突破性成果发表于《Communications Biology》,为理性化抗体设计提供了全新视角。
研究团队主要采用三大关键技术:1)基于10x Chromium 5'平台的单细胞转录组测序,从58个生物项目中获取2482个测序实验数据;2)TRUST4算法组装配对抗体序列,结合RIOT工具进行IMGT标准化注释;3)通过4.5?原子距离阈值从RCSB PDB数据库中提取VH/VL界面接触残基,建立结构-功能关联模型。样本来源涵盖人类外周血、淋巴结、骨髓等组织,包含健康个体与COVID-19患者等不同免疫状态。
【数据库构建与特征】
研究人员从NCBI SRA中筛选58项符合标准的研究,最终获得1440万条有效序列,构成720万对重链/轻链组合。通过Chao2多样性估计,推算出人类抗体可变区组合可能达50亿种,但实际多样性受电荷限制等理化约束显著低于理论值。数据库分析显示κ与λ轻链比例符合已知生理分布(60:40),而小鼠数据中κ链占比异常高(90%)可能与特定实验设计相关。

【种系配对偏好性】
通过卡方检验发现V基因亚组配对存在显著非随机性(p?0.01)。IGHV3-23/IGHV1-46等特定重链与κ轻链的组合出现频率远超预期,这种偏好可能源于受体编辑过程中对低自反应性组合的选择压力。与临床阶段单抗对比发现,治疗性抗体过度依赖IGHV3-23(含蛋白A结合基序)和κ轻链,而天然抗体中λ链占比更高且可能具有更好的稳定性。

【结构界面特征】
从PDB结构中鉴定出36个关键接触位点,发现CDR3区域与配对链FWR2(框架区2)存在保守相互作用。特别值得注意的是,重链CDR3的氨基酸分布与随机配对存在显著差异(TVD=0.06),表明其构象可能受轻链FWR2调控。这种相互作用模式与经典Vernier区几乎无重叠,揭示了全新的链间调控机制。

【V-J基因互作】
分析发现IGHJ4与IGLJ基因存在强烈配对偏好,这种偏向可能源于重组信号序列(RSS)的特异性。同时,特定VH-JL和VL-JH组合的出现频率显著偏离随机分布,进一步证实种系基因选择在抗体成熟过程中的重要作用。
这项研究通过建立迄今最全面的配对抗体资源库,揭示了抗体组装的两大核心规律:种系编码的配对偏好性与结构界面特异的残基互作。这些发现对生物药开发具有多重意义:1)指导合理选择低自反应性的VH/VL组合,提高候选药物成功率;2)修正单抗开发中过度偏好κ链的误区,拓展λ链的应用潜力;3)为计算机辅助抗体设计提供关键参数,特别在CDR3-FWR2界面工程方面提供新思路。随着PairedAbNGS数据库的持续更新,这些发现将推动抗体工程进入更精准的理性设计时代。
生物通微信公众号
知名企业招聘