《Protein Science》:Unveiling nuclear localization signals in human arginine deiminase proteins
编辑推荐:
本文通过计算预测、多肽合成与多学科实验验证,系统揭示了人类PADI1、PADI2与PADI3同工酶中潜在核定位信号(NLS)的结构与功能。研究表明,这些预测的NLS肽段在溶液中呈无序单体状态,并能以低微摩尔级亲和力特异性结合入核转运蛋白Importin α3(Impα3)及其截短体(ΔImpα3),靶向其经典NLS结合位点。该工作不仅为理解PADI家族蛋白的核转位机制提供了关键分子基础,也为其在癌症、自身免疫病等疾病中的核内功能研究开辟了新视角。
引言
瓜氨酸化是一种由L-精氨酸亚氨基水解酶(PADIs,又称肽酰精氨酸脱亚氨酶)催化的翻译后修饰。PADIs参与细胞凋亡、组织衰老、神经生长、炎症、胚胎发育、上皮分化及基因表达的转录调控等多种生物学过程。类风湿关节炎、银屑病、阿尔茨海默病、多发性硬化症以及多种癌症的发生发展,均与PADI同工酶及其瓜氨酸化靶标在不同组织中的表达增加相关。
人类基因组中存在五个编码PADI蛋白的基因:PADI1、PADI2、PADI3、PADI4和 PADI6。每种同工酶在多种组织和器官中具有不同的表达模式,并普遍参与癌症相关进程。例如,PADI2参与肿瘤迁移、进展、血管生成、癌细胞耐药性,甚至促进细胞外囊泡数量增加;PADI3可通过介导运输肿瘤促进因子的细胞外囊泡形成,从而增加肿瘤细胞的侵袭性;PADI1则在角质形成细胞的终末分化中起关键作用,并在多种癌症中主要作为癌基因发挥作用。
所有PADI蛋白均存在于细胞质中,但上述部分功能提示它们也可能存在于细胞核内。例如,PADI4在细胞质和细胞核中均被检测到;在某些应激条件下,PADI2也存在于细胞核中。在细胞核内,PADI1、PADI2和PADI4能够瓜氨酸化组蛋白。这些发现表明,这些蛋白必须通过核孔复合体(NPC)进行转运。核转位通常由称为importins的特异性载体蛋白介导。最常描述的核输入途径是由importin α识别货物蛋白中的核定位信号(NLS)多肽片段而激活。Importin α是一种模块化蛋白,包含三个区域:(i)N端importin β结合(IBB)结构域;(ii)由10个ARM重复单元组成的、折叠良好的NLS结合结构域;(iii)一个短而无序的C端区域。
本研究团队先前已对理论预测的PADI4的NLS区域与其和importin α3(Impα3)及其缺乏IBB结构域的截短物种(ΔImpα3)的结合进行了研究。鉴于PADI1、PADI2和PADI3可能根据其某些功能进行核转位,本研究试图揭示它们假定的NLS区域。
结果
2.1 NLS肽段的构象特征
由于部分预测的NLS肽在生理pH水溶液中不溶,研究聚焦于可溶性肽的构象倾向及其与两种importin物种的相互作用。通过荧光、远紫外圆二色谱(CD)和核磁共振(NMR)研究对NLS肽的构象特征进行表征。荧光光谱表明,PADI1-NLS1在约350 nm处有最大发射峰,这是色氨酸溶剂暴露的特征;PADI2-NLS2和PADI3-NLS1的最大发射峰在~308 nm,这是酪氨酸的特征;PADI3-NLS2不含酪氨酸或色氨酸,未显示荧光光谱。
所有分离的NLS区域的远紫外CD光谱在~200 nm处显示一个最小值,表明肽具有无规卷曲构象。PADI1-NLS1在~225 nm处有一个小肩峰,可能是由于存在芳香族Trp549;PADI2-NLS2在~220 nm处有一个正带,可能是由于C端添加的单个酪氨酸残基或序列中其他天然芳香族残基(Phe501、His509和Phe515)的存在。
NLS区域的无序特性进一步被1D-1H-NMR谱证实,其显示所有酰胺质子信号集中在8.0至8.6 ppm之间,而大多数甲基质子信号在0.8至1.0 ppm之间,这些是归属于无序链的质子的典型值。此外,通过DOSY实验测量扩散系数D并利用斯托克斯-爱因斯坦关系估算的流体动力学半径Rh值,与具有相同分子量的无规卷曲多肽的理论值相似,表明所有NLS肽均为单体。同核2D-1H-NMR实验进一步证实了肽的无序性质:明确指认残基的序列校正构象位移Δδ在无规卷曲肽的公认范围内(Δδ ≤0.1 ppm),且仅检测到序列内NOE(如αN (i, i+1) 和 βN (i, i+1)),未检测到中长程NOE。
因此,可以得出结论,所有NLS肽在分离状态下均为具有无序构象的单体。
2.2 PADI1、PADI2和PADI3的NLS肽段能够与Impα3和ΔImpα3结合
为测试可溶性肽段是否在体外与Impα3和ΔImpα3相互作用,研究采用了两部分实验方法。首先,使用稳态内源荧光和远紫外CD作为光谱技术观察可能的结合及伴随的构象变化;其次,使用内源荧光和等温滴定量热法(ITC)定量测量这种结合的热力学参数,并使用生物层干涉技术(BLI)测定结合反应的动力学参数。
荧光实验显示,当任何NLS肽与Impα3形成复合物时,在280 nm或295 nm激发下,与两种单独多肽光谱的加和谱相比,复合物光谱的荧光强度均发生变化,部分情况下最大发射波长也发生改变。与ΔImpα3形成复合物时也观察到类似变化。这些结果表明存在结合。
远紫外CD测量结果进一步证实了结合,并显示出三种不同的趋势,反映了结合对肽段和importin构象的影响程度不同。综合稳态荧光和远紫外CD光谱结果,可以得出结论:四种肽段中的每一种都能与每种importin物种结合。
接下来,研究定量测定了NLS肽段对每种importin物种的亲和力。通过荧光滴定测定亲和常数,固定每种importin物种的浓度,增加相应肽的浓度。在可拟合的情况下,获得的解离常数Kd在低微摩尔范围。ITC滴定量热分析显示,所有肽段都能与每种importin物种结合,且结合是熵驱动的。NLS肽段与ΔImpα3的结合亲和力高于与Impα3的结合,这可能是由于截短蛋白物种中移除了60个残基长的IBB结构域,该结构域可能竞争结合importin中的NLS识别位点,从而倾向于阻碍货物蛋白通过NLS区域的结合。ITC测定的亲和力与荧光滴定在可获得可靠结合曲线的情况下测定的范围相似。
最后,BLI实验用于估算每种肽段的表观亲和常数。对于PADI1-NLS1、PADI2-NLS2和PADI3-NLS2,获得了可靠的传感图。对于PADI1-NLS1和PADI2-NLS2,与Impα3和ΔImpα3结合的kon和koff值在误差范围内相同,因此表观亲和力Kd值对于两种importin物种在误差范围内相同。这些BLI测定的亲和力值与ITC测定的ΔImpα3的亲和力值相似。对于PADI3-NLS2与Impα3的结合,其kon和koff速率均比PADI1-NLS1和PADI2-NLS2慢;而与ΔImpα3结合时,kon相似,但koff快一个数量级。由于分子量接近BLI制造商设定的检测下限,未获得PADI3-NLS1的可靠传感图。
2.3 分子模拟显示NLS肽段靶向NLS结合位点
一个重要的问题是验证模拟PADI蛋白NLS的肽段是否确实锚定在Impα3的经典结合位点。由于NLS肽段的无序性质以及测得的与Impα3结合的亲和常数范围,通过X射线晶体学、NMR和冷冻电镜等标准结构技术研究这一问题具有挑战性。分子模拟也因NLS肽段的高构象灵活性而面临困难。
为应对这一挑战,研究使用了最先进的分子对接算法DiffDock。使用ΔImpα3的结构进行对接,不考虑IBB结构域。对接结果显示,尽管各种对接构象之间存在差异,但所有肽段都靶向Impα3内部的弯曲区域,大致沿蛋白质结构的矢状面。虽然获得的置信度分数表明对于此类长且无序的肽段结合模式预测存在固有挑战,但结果具有启发性。
研究还分析了肽段缩短版本与Impα3的结合,旨在降低计算复杂性,并更准确地确定经典NLS结合位点是否是预测NLS序列核心区域靶向的热点。结果显示,所有四种NLS肽段,即使是缩短版本,也与色氨酸残基Trp137、Trp222和Trp264产生接触,这些是支持NLS锚定到Impα3的关键氨基酸。获得的置信度分数相比全长肽段有明显改善。此外,从PADI同工酶的AlphaFold预测结构中提取的蛋白质片段开始的对接模拟结果也显示,即使从NLS片段在PADI同工酶天然结构中的闭塞状态构象开始,肽段的对接构象也大部分是伸展的且很大程度上与溶剂接触,并且都清晰地靶向了Impα3活性位点中的色氨酸残基。
总之,对接模拟的总体结果表明,所有研究的NLS肽段都靶向Impα3表面一个明确的单一热点,该热点对应于货物蛋白NLS的预期结合位点。结合涉及Impα3表面的多个色氨酸残基,这与荧光滴定实验的提示一致。这些模拟结果提示,四种预测的NLS具有作为PADI1、PADI2和PADI3核转位标签序列所需的结合特征。
讨论
PADI家族的五个同工酶是催化精氨酸向瓜氨酸转化的翻译后修饰的酶。这些蛋白质调控关键的细胞过程,并参与许多重要疾病。迄今为止,PADI4以及在某些条件下的PADI2,是PADI家族中唯一在细胞核和细胞质中均被实验观察到的成员。然而,PADI1对组蛋白的瓜氨酸化对早期胚胎发育至关重要。此外,PADI3参与与细胞迁移、侵袭和存活相关的基因转录酶的直接调控,作为癌基因和肿瘤抑制因子发挥作用。因此,从它们的功能和生物学底物判断,似乎所有这些蛋白质在细胞生命周期中都应该被转运到细胞核。
通过使用基于NLS预测工具cNLS Mapper合成的肽段,本研究的体外生物物理结果显示了PADI2的一个假定NLS区域,以及或许更有趣的是,PADI1的一个假定NLS和PADI3的两个可能NLS。这四个区域能够与importin家族的核载体Impα3及其IBB结构域缺失的物种ΔImpα3相互作用。分子对接模拟也证明,NLS肽段具有靶向Impα3折叠结构域N端区域货物蛋白NLS经典结合位点的明显能力。总体而言,这些发现清楚地表明,四种预测的NLS具有其所属PADI蛋白物种核转位标签信号的典型分子特征。
研究测量了NLS肽段对特定importin(Impα3)的结合亲和力,但无法排除PADI1、PADI2和PADI3中其他预测的NLS区域(由于作为分离多肽不溶而未研究)也可能是真正的NLS。因此,在任何预测区域都可能用于核转位,取决于环境条件,从而使PADI蛋白能够在不同情况下调节它们与importins的结合。
有趣的是,将本研究获得的kon和koff速率值与之前测量的其他分离NLS肽段的数值进行比较,并未发现importin物种与其不同PADI货物结合动力学速率之间的简单关系。
研究还证明,四种分离的NLS肽段是无序的,并且没有任何获得螺旋或转角构象的倾向。先前对其他内在无序蛋白NLS的研究表明,IBB结构域具有抑制作用:该结构域阻碍相应货物蛋白的NLS锚定到Impα3的主要NLS结合区域。在此背景下,观察到四种NLS区域与ΔImpα3的结合亲和力强于与Impα3的结合,这与之前测试的其他NLS肽段的发现一致。两种importin物种之间亲和常数的差异可能是由于60个残基长的IBB与NLS竞争NLS锚定区域。
本研究还对PADI1、PADI2和PADI3中可能存在的NLS区域做出了几项预测,尽管不能排除不溶性肽段也可能是相应完整蛋白中真正的NLS。这些预测应在未来的工作中通过使用蛋白质工程方法来阐明特定PADI1、PADI2或PADI3残基对与importin物种结合的重要性加以验证。PADI2-NLS2区域可能负责完整PADI2的核转位,导致在几种癌症发展过程中某些组蛋白的瓜氨酸化。PADI1-NLS1区域可能参与PADI1的核转位,导致对早期胚胎发育至关重要的组蛋白瓜氨酸化。最后,对于其核功能尚未明确确立的PADI3,PADI3-NLS1或PADI3-NLS2可能是两个不同的NLS区域,可能允许其在不同的细胞条件下进行核转位。