
-
生物通官微
陪你抓住生命科技
跳动的脉搏
局部蛋白质结构特征对主要组织相容性复合体I/II类抗原呈递预测的影响机制研究
【字体: 大 中 小 】 时间:2025年08月08日 来源:Briefings in Bioinformatics 7.7
编辑推荐:
本研究针对抗原呈递预测中局部蛋白质结构特征的潜在影响,通过整合无序评分、相对表面可及性及α-螺旋/β-折叠/卷曲概率等结构特征,构建了基于NNAlign框架的MHC-I和HLA-DR抗原呈递预测模型。研究发现结构特征对MHC-I预测无显著提升,但对HLA-DR(尤其内体溶酶体来源肽段)呈现有限但统计学显著的性能增益,揭示了亚细胞定位对结构特征效用的调控作用,为精准疫苗设计提供新思路。
在免疫防御的精密作战中,主要组织相容性复合体(MHC)分子如同情报官,将病原蛋白片段呈递给T细胞以启动免疫应答。然而这个过程的预测始终存在盲区——蛋白质的三维结构特征是否会影响抗原呈递效率?早期研究发现MHC-I配体倾向源自α-螺旋区域,而MHC-II配体则与相对表面可及性(RSA)相关,但这些结论均基于小规模数据。随着免疫治疗精准化需求日益迫切,解析结构特征对抗原加工通路的调控机制成为突破预测瓶颈的关键。
丹麦技术大学(Technical University of Denmark, DTU)健康技术系的Yat-tsai Richie Wan和Morten Nielsen团队在《Briefings in Bioinformatics》发表的研究,通过机器学习首次系统评估了局部蛋白质结构对两类MHC分子抗原呈递的影响。研究采用NetSurfP-3.0预测的5种结构特征(无序性、RSA、α-螺旋/β-折叠/卷曲概率),将其整合至改进的NNAlign框架中,训练数据涵盖90万MHC-I和92万HLA-DR配体,并引入DeepLoc-2.1进行亚细胞定位分析。
关键技术方法包括:1) 基于NetSurfP-3.0提取残基水平结构特征;2) 采用NNAlign框架构建六种预测模型(基线模型、均值模型及四种结构特征组合模型);3) 通过五折交叉验证和独立测试集评估;4) 利用DeepLoc-2.1对源蛋白进行亚细胞定位分群(胞质/内体溶酶体/模糊组);5) 采用bootstrap检验分析性能差异显著性。
结构特征对MHC-I预测影响有限
通过比较六种模型在AUC0.1等指标的表现,发现仅pq3模型(含二级结构概率)在训练集呈现微幅但显著的性能提升(AUC从0.9788→0.9793,P<0.05),但该优势未能在测试集复现。这表明MHC-I配体加工过程中蛋白质的完全去折叠可能消除了结构特征的预测价值。
HLA-DR预测获有限但稳定提升

"All"模型(整合全部结构特征)在测试集显著优于基线模型(AUC0.1 0.8064 vs 0.7994,P<0.001)。特征重要性分析揭示RSA、β-折叠和卷曲概率对预测得分影响最大(Δscore下降显著,P<0.0001),而α-螺旋和无序性贡献较弱。值得注意的是,这种增益与训练数据量密切相关(图4),暗示模型需要足够样本才能捕捉结构特征的微妙影响。
亚细胞定位决定结构特征效用
对内体溶酶体来源肽段,"All"模型在所有指标上均显著优于基线(PPV 0.5604→0.5701,P<0.0001),而胞质肽段未见改善。这与MHC-II的"先结合后切割"加工模型吻合——内体途径中蛋白质可能保留部分天然结构,使得表面可及性等特征影响蛋白酶切割效率;而胞质肽段经泛素-蛋白酶体系统彻底线性化,结构信息随之湮灭。
这项研究确立了局部蛋白质结构在MHC-II抗原呈递预测中的边际但不可忽视的作用,尤其为内体途径来源抗原的精准预测提供了新维度。其创新性在于:1) 通过超大规模数据验证了早期假设;2) 揭示亚细胞加工通路对结构特征预测效力的调控作用;3) 开发了可扩展的结构特征整合框架。尽管当前性能提升幅度有限(AUC0.1提升约0.7%),但该发现为开发针对不同抗原来源的定制化预测算法指明了方向,对肿瘤新抗原疫苗设计具有潜在转化价值。未来研究可结合冷冻电镜等结构生物学技术,进一步解析特定结构模体与蛋白酶切割效率的分子机制。
生物通微信公众号
知名企业招聘