基于序列的凝聚相组成预测揭示无序区多价相互作用可产生特异性
【字体:
大
中
小
】
时间:2025年10月15日
来源:Communications Chemistry 6.2
编辑推荐:
本研究针对生物分子凝聚体组成特异性的物理机制难题,通过开发一种结合Flory-Huggins平均场理论和随机相近似(FH-RPA)的聚合物物理模型,仅基于多价静电相互作用即可准确预测内在无序区(IDR)进入MED1IDR凝聚体的分配系数。实验验证表明,该模型能成功识别高分配区域,并揭示电荷模式特异性可源于无序区间的动态多价相互作用,无需依赖有序结构介导的相互作用,为理解生物分子凝聚体的组成调控提供了新范式。
在细胞生物学领域,生物分子凝聚体作为无膜细胞器,通过液-液相分离(LLPS)形成特定的微环境,对其组成分子的选择性招募机制的理解仍不充分。传统观点认为生物分子相互作用的特异性通常需要有序结构的参与,然而许多由内在无序区(IDR)形成的凝聚体在缺乏明显结构有序性的情况下仍能表现出组成特异性。这引出了一个核心科学问题:这种特异性究竟是源于尚未发现的有序结构介导的相互作用,还是源于无序区中带电氨基酸模式之间的动态多价相互作用?
为了解决这一难题,研究人员在《Communications Chemistry》上发表了最新成果。他们以中介体复合物最大亚基MED1的内在无序区(MED1IDR)形成的凝聚体为模型系统,此前研究发现该凝聚体能特异性招募RNA聚合酶II(RNA Pol II)及其正调控因子(如SPT6),同时排除负调控因子(如NELFE),这种功能分区被认为与无序区上的电荷区块模式有关。然而,其背后的物理原理始终悬而未决。
为了回答这些问题,研究团队开发了一种名为FH-RPA的计算模型。该模型将Flory-Huggins(FH)平均场理论与随机相近似(RPA)相结合,用于预测IDR序列进入由MED1IDR搭建的预形成凝聚体的分配系数(PC)。模型的核心在于一个Flory相互作用参数χij,它包含了仅依赖于净电荷的零阶项和捕获序列电荷模式信息的一阶RPA项。模型的参数通过拟合31个IDR序列的实验测量PC值进行优化。
研究人员运用了几项关键技术方法来支撑其研究。首先,他们采用了基于细胞的高通量荧光显微镜筛选技术,利用整合了LacO DNA元件的U2OS细胞系(样本队列来源),通过CFP-LacI-MED1IDR在特定基因组位点形成合成凝聚体,并测量mCherry标记的待测蛋白在该凝聚体内的分配情况。其次,开发了FH-RPA分析模型,通过计算序列电荷模式相关的相互作用参数来理论预测分配系数。此外,还运用了滑动序列分析法和滑动窗口分析法,分别用于直观展示序列依赖性相互作用以及扫描全长蛋白质以识别高分配区域。进化保守性分析则用于比较不同物种间PC谱的相似性。最后,通过点突变实验(如芳香族氨基酸突变为丙氨酸)来验证非静电相互作用(如阳离子-π相互作用)对分配的贡献。
研究的基本原理是,IDR进入MED1IDR凝聚体的分配受多重链相互作用支配,其中IDR和MED1IDR链构象预期是无序的。因此,相关的热力学性质应由对可能构型的统计平均所决定。研究提出了一个直观的“滑动序列”分析方法,通过计算客户序列在支架序列上滑动时(包括平行和反平行排列)的玻尔兹曼平均相互作用能,来近似表征客户-支架相互作用的强弱。通过对简单模型序列以及天然无序区(如NELFE和SPT6)的分析表明,具有更区块化电荷模式的序列与MED1IDR的相互作用更有利,这为实验观察到的分配差异提供了物理解释。
FH-RPA模型是本研究的核心创新。如公式PCi(theory) = c1 + c2 χij Ni所示,理论预测的PC与χijNi呈线性关系。其中χij的静电部分χe,ij由零阶平均场项(χe(0))ij和一阶RPA项(χe(1))ij构成。RPA项通过积分包含序列电荷模式信息的函数Ai(k)和Aj(k)的乘积来捕获序列特异性。优化后的模型在考虑序列电荷模式后,理论预测与实验PC值的Pearson相关系数从仅考虑净电荷时的约0.35提升至约0.67,显著改善了对实验数据的解释能力。
FH-RPA model rationalizes effects of charge scrambling on IDR PCs
为了验证FH-RPA模型识别电荷模式效应的能力,研究人员分析了SPT6IDR和NELFEIDR的电荷扰乱变体。模型预测和实验结果表明,打乱所有氨基酸(完全扰乱)或仅打乱带电氨基酸(电荷扰乱)从而破坏电荷区块化模式,会降低分配;而打乱非带电氨基酸但保持野生型电荷模式(非电荷扰乱)则不影响分配。对于NELFEIDR,通过重排带电氨基酸引入电荷区块后,实验测量和模型预测的PC值均增加。这些结果证明,FH-RPA模型能够解释在平均电荷性质相同的情况下,由序列模式改变引起的分配变化,而仅基于组成的平均场理论无法做到这一点。
FH-RPA model successfully identifies high-PC regions in proteins
考虑到链长对预测PC的显著影响以及分配过程中构象熵的可能作用,研究人员通过滑动窗口分析(窗口大小为200个氨基酸)来识别全长蛋白质中的高PC区域。该方法应用于已知的分配蛋白CTR9和SPT6时,成功识别出的高PC区域与之前实验确定的对其分配必要且充分的区域惊人地一致。并非所有预测的无序区域都具有高预测PC,表明电荷或电荷模式特征至关重要。这证明了FH-RPA模型在扫描全长蛋白质以识别负责分配的区域方面的实用性。
PC profiles are conserved despite a reduction in positional sequence conservation
对来自不同物种(人、小鼠、鸡、青蛙和鱼)的SPT6和CTR9蛋白序列进行PC谱分析发现,尽管随着进化距离增加,这些高PC区域的氨基酸序列一致性(% identity)显著降低,但它们的PC谱却高度相似。定量比较PC谱相似性(使用公式Si,i' = [Σs xs(i) xs(i')] / [sqrt(Σs (xs(i))2) sqrt(Σs (xs(i'))2)])表明,高PC值是一种进化保守的特征,即使位置序列保守性降低。细胞实验证实,所有测试物种的SPT6和CTR9的高PC区域均能有效地分配到MED1IDR凝聚体中。
FH-RPA model successfully predicts low-PC and high-PC IDR windows
为了进一步测试模型的预测能力,研究人员对人类蛋白质组中涉及转录的核蛋白的长(≥200 aa)末端无序区进行了大规模扫描分析,计算了165,621个区域的PC值。通过比较具有相似等电点但不同预测PC得分的序列,筛选出4个预测高PC和7个预测低PC的区域进行实验验证。细胞实验表明,4个预测高PC的区域全部显示出显著的分配富集,验证了模型的正向预测能力。然而,7个预测低PC的区域中,有3个(CDCA7L, ADNP, ST18)出乎意料地表现出中等到高的实验分配。
FH-RPA model can be improved by including non-electrostatic effects
对模型预测出现偏差的分析指出,当前FH-RPA模型未考虑非静电相互作用是主要原因。比较发现,被正确预测为低PC的IDR最多含有4个芳香族残基,而那3个预测偏差的IDR则含有较多(≥10个)芳香族残基。鉴于MED1IDR含有大量阳离子残基(75个K, 18个R),多价阳离子-π相互作用可能在其中发挥作用。采用包含π相互作用的Mpipi势能进行滑动序列分析发现,加入非静电效应后,那3个异常序列的玻尔兹曼平均能量变得更为有利,尽管仍不及正确预测的高PC序列,但这表明纳入非静电效应可以提高预测准确性。作为验证,将CDCA7L、ADNP和ST18 IDR序列中的芳香族残基突变为丙氨酸后,这些突变体在细胞中的分配显著降低至与对照无异的水平,证实了芳香族残基通过非静电相互作用对分配的贡献。
研究结论与讨论部分强调,这项工作表明,基于多价静电相互作用的聚合物物理模型能够很大程度上解释MED1IDR凝聚体观察到的选择性分配现象,而无需假设有序结构介导的相互作用。FH-RPA模型作为一个高通量分析工具,能够有效扫描蛋白质序列并预测其分配行为,预测结果与已有实验数据定性吻合,并对新序列的预测得到了实验验证。该研究揭示了生物分子凝聚体组成特异性可以通过无序区域间动态多价相互作用的统计特性来产生,为理解这类无膜细胞器的组装和功能调控提供了新的物理框架。研究也指出了模型的局限性,即当前版本主要考虑静电相互作用,对于富含芳香族残基等可能涉及显著非静电作用的序列,预测会出现偏差,未来通过纳入如疏水和芳香相互作用等非静电贡献,可以进一步完善模型。此外,研究发现的PC谱进化保守性,即使在高PC区域的序列一致性很低的情况下依然存在,加深了对无序区域功能保守性的认识,提示整体分子特征(如电荷模式)而非精确的氨基酸序列在功能维持中的重要性。总之,这些发现强有力地证明了在构象无序的背景下,多价相互作用本身足以产生生物分子凝聚体组成的特异性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号