编辑推荐:
为探究表观基因(epigenes)功能多样性的来源及其与疾病的关联,研究人员开展了关于表观基因在基因结构、异构体、蛋白质结构域和多蛋白复合物形成等方面的研究。结果发现表观基因在这些方面存在显著特征,这为相关疾病的靶向治疗提供了新方向。
在生命的奇妙旅程中,基因组就像一本记载着生命蓝图的宝典,然而这本宝典的信息表达并非一成不变。在生物体发育过程里,细胞需要根据不同的需求,精准地调控基因表达,塑造出多种多样的细胞类型和复杂的生物结构。这其中,表观基因组(epigenome)发挥着关键作用,它就像是基因组的 “调控开关”,通过对基因组进行化学和物理修饰,决定哪些基因开启、哪些基因关闭。而表观基因(epigenes)则是掌控这些开关的 “幕后英雄”,它们参与表观基因组的调控、修饰和维持工作,对生物体的正常发育至关重要。
不过,目前仍有诸多谜团围绕着表观基因。虽然已知表观基因的突变与多种人类疾病密切相关,比如在癌症的发生发展中,体细胞的表观基因突变常常是重要的 “帮凶”,成为疾病预后的关键指标;在一些复杂的综合征中,生殖细胞的表观基因突变也脱不了干系。但到现在,还没有对表观基因功能多样性的来源进行过系统的分析。而且,表观基因是如何凭借有限的数量,实现如此复杂多样的功能,进而影响生物体的健康和疾病发展的,依旧是未解之谜。为了揭开这些神秘的面纱,来自美国加州大学洛杉矶分校(UCLA)的研究人员踏上了探索之旅。他们的研究成果发表在《Epigenetics & Chromatin》杂志上,为我们理解表观基因的奥秘带来了新曙光。
研究人员在此次研究中运用了多种关键技术方法。他们从多个公开数据库获取数据,如 Ensembl、ENCODE、GTEx 等,以定义基因集、获取基因结构注释等信息;利用置换检验(permutation tests)对比表观基因和非表观基因的差异;采用熵(entropy)和散度(divergence)量化异构体表达的多样性;从 EMBL-EBI Complex Portal 获取多蛋白复合物信息,从 UniProtKB 获取蛋白质无序结构域注释,还通过 OMIM 和 HPO 分析综合征表型,从 GTEx 和 ENCODE 获取并处理表达数据,以及对 BrainSpan 数据进行分析。
下面来看具体的研究结果:
- 表观基因的结构特征:研究发现,与非表观基因相比,表观基因的基因和转录本更长,外显子数量更多。例如,表观基因的基因大小几何平均为 41.4 kb,而非表观基因仅为 21.8 kb;表观基因 mRNA 转录本几何平均为 4.0 kb,非表观基因则是 2.7 kb。这种结构差异使得表观基因能产生更多的异构体,增加了转录的多样性。
- 异构体表达的复杂性:表观基因编码的异构体数量明显多于非表观基因,且在组织内,表观基因平均表达的异构体种类更为多样。不过,在不同组织之间,表观基因的异构体表达谱却更为相似。这表明表观基因在维持细胞功能的同时,又能根据组织的需求进行精细调控。
- 多变的结合伙伴:在多蛋白复合物方面,表观基因比非表观基因更易与多蛋白复合物关联,且其可变结合伙伴的数量显著增加。以 KAT6A 蛋白为例,它能参与至少三种不同的复合物,这大大拓展了表观基因的功能范围。
- 广泛存在的无序结构域:研究还发现,表观基因富含内在无序区域(IDRs)。这些无序结构域在表观基因中所占比例更大,且最大的连续无序结构域也更长,这可能有助于表观基因在细胞核内进行组织和靶向特定基因组区域。
- 与疾病的关联:在研究表观基因与疾病的关系时,发现表观基因相关的孟德尔疾病大多遵循显性遗传模式,且相关综合征更易影响多个身体系统,尤其是神经系统和肌肉骨骼系统。这与表观基因的广泛表达以及在早期发育过程中的重要作用密不可分。
- 药物调控的可能:通过对 BrainSpan 数据的分析,研究人员发现许多表观基因在人类大脑发育过程中都有表达,并且呈现出动态变化。此外,利用 L1000 数据集,他们还识别出了一些药物,这些药物有可能用于调节表观基因的表达,为治疗相关疾病带来了新的希望。
综合来看,这项研究全面地揭示了表观基因功能多样性的来源,从基因结构、异构体表达、蛋白质相互作用到与疾病的关联,都进行了深入探讨。研究结果不仅加深了我们对表观基因功能的理解,还为开发针对表观基因突变引起的疾病(如染色质病和癌症)的靶向治疗方法提供了重要的理论基础。不过,研究也存在一定的局限性,由于是基于公开数据库进行分析,难以评估表观基因突变的直接和机制性影响,而且可能还有部分表观基因未被发现。但无论如何,这项研究为该领域的后续研究指明了方向,相信在未来,随着技术的不断进步和研究的深入,我们将对表观基因有更全面、更深入的认识,从而为人类健康事业带来更多的福祉。