《Computers in Biology and Medicine》:Demystifying the implications of disease-susceptible missense SNPs within CTLA-4 ligand binding domain and its interaction towards B7-1 protein complex: Bioinformatics-driven evidence
编辑推荐:
本研究利用计算生物学方法筛选出CTLA-4基因中17个高致病性非同义单核苷酸多态性(nsSNPs),其中9个具有进化保守性并显著改变蛋白质理化性质、三维结构及翻译后修饰位点。通过分子对接与分子动力学模拟发现,P137L(rs1553657429)和N145H(rs1356678649)这两个SNPs分别通过破坏MYPPPY结构基序和N-糖基化修饰降低与B7-1蛋白的结合亲和力,影响免疫调节功能。
V. Shamala | S. Preethi | V. Hemamalini | S. Asha Devi
印度泰米尔纳德邦韦洛尔市韦洛尔理工学院生物医学科学系,邮编632014
摘要
三联体密码子中一个核苷酸的改变会导致蛋白质序列中替换为不同的氨基酸,这种现象统称为错义或非同义单核苷酸多态性(nsSNPs)。胞质T淋巴细胞抗原-4(CTLA-4)基因编码一种在活化T细胞上表达的跨膜蛋白。CTLA-4受体作为一种免疫调节分子,通过快速抑制T细胞介导的免疫反应(包括T细胞的失活和清除)来促进免疫自耐受。CTLA-4编码区域内的多态性可能通过减少其与抗原呈递细胞(APCs)上表达的B7配体(B7-1: CD80和B7-2: CD86)的相互作用,从而有效干扰跨内吞作用过程。在本研究中,我们利用多种计算技术预测了可能影响CTLA-4蛋白结构和功能的高致病性nsSNPs,并对其与CD80蛋白复合物进行了计算对接和分子动力学(MD)模拟。研究发现,有17个nsSNPs对CTLA-4蛋白具有高度致病性和结构不稳定作用。进一步的进化ConSurf分析表明,9个nsSNPs高度保守,并且会影响CTLA-4蛋白的生物物理化学性质、三维RNA结构、翻译后修饰位点以及二级和三级结构。CTLA-4/CD80蛋白复合物的分子对接结果显示,rs1553657429-P137L和rs1356678649-N145H nsSNPs显著降低了CTLA-4与B7-1蛋白的结合亲和力。MD模拟还表明,位于配体结合域(MYPPPY基序)内的P137L位点和N-糖基化位点上的N145H位点的突变,会通过降低CTLA-4蛋白的结构稳定性和灵活性,从而干扰其与B7-1蛋白的结合。
引言
人类基因组的三分之一包含300万到1000万个错义或非同义单核苷酸多态性(nsSNPs),这些多态性对蛋白质的结构和功能具有重要影响[1]。错义SNPs通过改变蛋白质的疏水性及氨基酸电荷,导致蛋白质结构不稳定[2]和基因表达异常[3],最终降低蛋白质与理想伴侣的相互作用,阻碍蛋白质-蛋白质复合物的形成。大约50%的错义突变被认为是导致遗传疾病(如自身免疫性疾病和炎症性疾病)的因素[4,5]。多项计算机模拟研究揭示了nsSNPs对蛋白质功能和结构属性的显著影响。例如,对补体系统关键因子C1q基因的生物信息学分析表明,高风险错义突变与系统性红斑狼疮有显著关联[6]。对人类白细胞介素-6基因的计算机模拟研究表明,nsSNPs会促进细胞因子的过度表达,而这些细胞因子与类风湿性关节炎(RA)和强直性脊柱炎等复杂自身免疫性疾病有关[7]。转录因子STAT3基因中的有害错义突变与人类癌症和炎症性肠病密切相关[8]。
免疫系统的防御机制很大程度上依赖于细胞间的信息交换,即抗原呈递细胞(APCs)将抗原传递给T细胞,从而激活和增殖淋巴细胞。活化T细胞表面标记物(如Cluster Differentiation 28(CD28)和胞质T淋巴细胞抗原-4(CTLA-4))的特异性表达调节了T淋巴细胞的生物学功能[9]。CTLA-4和CD28(共受体)具有同源序列(MYPPPY基序),能够识别APCs上表达的B7配体(B7-1: CD80和B7-2: CD86)。然而,这些分子具有维持T细胞介导的免疫反应与自身耐受之间平衡的特定生物学功能。CD28是一种共刺激分子,通过与APCs上的B7配体结合来触发T细胞的激活和增殖,同时诱导白细胞介素-2的分泌及记忆T细胞的增殖[10,11]。而CTLA-4则通过向T细胞传递负信号起到免疫调节作用。CTLA-4与B7配体的结合亲和力高于CD28受体[12]。随后,CTLA-4通过使CD28共刺激信号失效或破坏T细胞来介导免疫自耐受[13]。
CTLA-4基因位于人类2号染色体2q33.2区域,属于免疫球蛋白超家族。CTLA-4蛋白序列由223个氨基酸组成,包含四个不同的外显子:信号肽、配体结合域、跨膜区域和胞质域[14,15]。多项研究探讨了CTLA-4多态性在多种恶性和自身免疫性淋巴增生性疾病(如RA[16,17]、多发性硬化症[18]、1型糖尿病[19]、乳腺癌[20]、肺癌[21]、宫颈癌[22]和结直肠癌[23]中的作用。研究CTLA-4基因中的有害nsSNPs是理解其对蛋白质结构和功能影响的有效方法。以往的研究主要局限于与CD80(B7-1)蛋白复合物相关的分子对接和动态模拟[24,25]。我们的计算研究旨在筛选CTLA-4基因中高致病性的nsSNPs,并分析其在功能域、致病性、蛋白质稳定性、进化保守性、结构影响、生物物理化学性质、三维(3D)RNA结构、二级和三级蛋白质结构以及翻译后修饰位点方面的潜在作用。随后,对高风险的CTLA-4 nsSNPs进行了计算对接和分子动力学(MD)模拟,以确认它们对其伴侣蛋白B7-1的影响。
数据库中CTLA-4 SNP的检索
高度有害的CTLA-4 nsSNPs
在dbSNP数据库中,CTLA-4基因下共记录了3134个SNPs(错义:186个(5.93%),内含子:1491个(47.57%),同义:91个(2.90%)。位于蛋白质编码区域的nsSNPs可能对蛋白质生物合成产生重大影响。为了筛选导致慢性人类疾病的CTLA-4基因中的有害nsSNPs,我们使用了多种生物信息学方法,包括SIFT、PROVEAN、Polyphen2、PHD SNP、SNAP、Meta-SNP、PANTHER、SNP & GO和FATHMM等。最终筛选出20个nsSNPs。
讨论
一个平衡的免疫系统对维持人类健康至关重要。CTLA-4基因在调节免疫系统的周围耐受性和稳态中起着重要作用。CTLA-4蛋白主要在调节性T细胞上表达,而在常规T细胞中,CTLA-4受体则储存在高尔基体中,在T细胞活化时释放到细胞表面。CTLA-4是一种在T细胞上表达的糖蛋白,作为共抑制分子抑制自身反应性免疫反应。
结论
我们的计算分析表明,位于脯氨酸富集区MYPPPY基序内的CTLA-4 P137L nsSNPs会干扰CTLA-4与CD80蛋白的细胞间通信,从而影响B7配体的跨内吞过程并促进CD28的参与,为T细胞活化创造有利条件。此外,CTLA-4 N145H nsSNPs的突变会破坏N-糖基化位点,进而干扰CTLA-4与CD80蛋白复合物的形成。
CRediT作者贡献声明
V. Shamala:撰写初稿、方法学设计、实验实施。
S. Preethi:数据验证、软件使用、实验协助。
V. Hemamalini:数据验证、软件使用、实验协助。
S. Asha Devi:撰写修改、监督、实验指导、概念构思。
伦理声明
本文题为“揭示CTLA-4配体结合域中易致病变义SNPs的影响及其与B7-1蛋白复合物的相互作用:基于生物信息学的证据”,正在您的期刊《Computers in Biology and Medicine》上考虑发表。该研究完全基于生物信息学分析,使用了美国国家生物技术信息中心dbSNP数据库中的公开数据。
资助
本研究未获得任何公共、商业或非营利机构的资助。
利益冲突声明
作者声明与本文报告的研究内容不存在任何已知的利益冲突或个人关系。
致谢
作者感谢印度泰米尔纳德邦韦洛尔理工学院和巴拉蒂亚尔大学提供的支持和基础设施支持,使本研究得以顺利进行。