编辑推荐:
本文聚焦内在无序蛋白质和区域(IDPs 和 IDRs),探讨从其结构集合获取生物学见解的方法及整合生物学挑战。介绍了无序蛋白质系统整合建模方法,阐述 IDRs 翻译后修饰(PTMs)的调控作用,展望未来研究方向,为相关领域提供参考。
引言
在各种生物体的蛋白质组中,有相当比例的蛋白质序列无法形成稳定的三维折叠结构,这类蛋白质不容忽视。据 SPOTDisorder 预测,人类蛋白质组中约 60% 存在至少 30 个连续氨基酸的无序蛋白区域(IDRs)。也有研究表明,52 - 67% 的真核生物蛋白质拥有至少 40 个连续氨基酸长的 IDRs。内在无序蛋白质和区域(IDPs 和 IDRs)是结构生物学中一个有待深入探索的领域,从它们所形成的结构集合中,我们对其功能的了解仍有许多空白。
尽管近年来蛋白质结构预测工具取得了众多进展,但主要集中于能形成明确三级折叠的蛋白质,这些工具并不适用于 IDRs/IDPs。因此,需要新的计算方法和实验数据来揭示 IDPs/IDRs 的构象集合。目前,单链 IDPs 的建模流程逐渐成熟,但多数无序区域存在于具有折叠结构域的蛋白质中,且 IDRs 常通过与折叠结构域及其他 IDRs 的动态相互作用发挥功能,在折叠区域背景下以及与其他蛋白质形成的动态复合物中对 IDRs 进行建模的方法还较少,本文将阐述这些复杂的无序系统。
无序蛋白质系统的整合建模方法
生成孤立无序链的结构集合,需要用实验数据与初始的各种可能结构构象进行比较、筛选(子集选择或重新加权)。目前,有三种主要的计算机模拟方法可生成初始构象库:一是全原子或粗粒度分子动力学(MD)模拟;二是生成式机器学习(ML)模型;三是统计学方法。
IDRs 的翻译后修饰调控
IDRs 由于其可及性,是蛋白质翻译后修饰(PTMs)的主要位点。核小体核心颗粒是染色质的关键单元,核小体组蛋白含有大量 IDRs,是 PTMs(即表观遗传标记)的主要发生部位。例如,组蛋白 H4 尾部赖氨酸乙酰化(H4Kac)在体外会影响染色质结构,阻碍 30nm 纤维的形成,尽管其详细机制仍存在争议,MD 模拟在研究这一过程中发挥了重要作用。
展望
近年来,单链 IDPs 的集合模型构建已较为成熟,这得益于 MD 和基于知识的采样技术的优化。随着研究向更复杂系统推进,需要精度更高的反算器,以适用于多链动态复合物以及存在翻译后修饰(PTMs)的 IDPs/IDRs。目前用于分析构象集合的反算器还不能完全满足需求,未来这将是研究的重点方向之一。
总结与展望
本文介绍了越来越多关于 IDRs 和动态复合物的结构集合实例,以及通过分析实验约束的构象集合或与实验对比的未优化集合所获得的有关功能的物理化学机制。这些研究为理解无序蛋白质系统的功能提供了重要依据,也为后续研究指明了方向,有望推动该领域取得更多进展。