综述:填补2型糖尿病变异与功能之间的空白:进展与挑战
《Diabetologia》:Bridging the variant-to-function gap in type 2 diabetes: advances and challenges
【字体:
大
中
小
】
时间:2025年11月23日
来源:Diabetologia 10.2
编辑推荐:
本综述系统梳理了近年来在解析2型糖尿病(T2D)遗传机制方面的重大突破。文章重点介绍了如何利用精细定位、染色质分析、单细胞多组学、可扩展的CRISPR扰动策略及机器学习工具等变异到功能(V2F)研究策略,将非编码风险变异与效应基因、作用组织及分子机制联系起来。作者通过跨关键代谢组织(如胰岛、脂肪、肝脏、肌肉)的典型案例(如TCF7L2、SLC16A11、FTO等),展示了V2F框架在揭示疾病异质性、解析致病通路方面的强大能力,并展望了这些进展为未来T2D精准医疗奠定基础的前景。
2型糖尿病(T2D)是一种复杂的多基因疾病,全球患者人数已超过5.3亿,预计到2050年将攀升至13亿。全基因组关联研究(GWAS)已成功鉴定了超过1289个与T2D相关的基因位点,然而,这些常见变异仅能解释约18-20%的疾病遗传力。更大的挑战在于,绝大多数风险变异位于非编码区域,其生物学功能难以直接解读,这构成了巨大的“变异到功能”(V2F)鸿沟。
T2D在临床和生物学上均表现出高度异质性。为了解析这种复杂性,研究人员开始对GWAS发现的变异进行聚类分析,例如使用k-means聚类或贝叶斯非负矩阵分解(bNMF)等方法。这些分析倾向于识别出一系列核心的生物学过程或内型,包括β细胞功能障碍、肝脏/脂质代谢、肥胖、胰岛素信号和脂肪营养不良等。例如,DGKB位点被归类于与β细胞应激相关的簇中,其编码的二酰基甘油激酶β(DGKB)通过调节细胞第二信使二酰基甘油(DAG)水平,可能在β细胞胰岛素原调节中扮演关键角色。这种遗传聚类为聚焦于共享生物学通路的实验研究提供了有力工具。
胰岛功能缺陷是T2D的核心环节。研究表明,T2D的GWAS信号在胰岛特异性调控元件中显著富集。例如,最强的T2D遗传信号位点TCF7L2,其风险变异的作用具有发育阶段特异性,在β细胞分化早期而非成熟β细胞中表现出增强子活性,揭示了其在β细胞发育中的关键作用。另一个典型案例是MTNR1B位点,风险变异rs10830963通过创建新的NEUROD1转录因子结合基序,增加MTNR1B(褪黑素受体1B)在胰岛中的表达,而褪黑素会抑制cAMP水平,从而损害胰岛素分泌,这为理解昼夜节律对血糖的调控开辟了新视角。
肝脏在葡萄糖和脂质代谢中居核心地位。17p13位点的T2D风险关联揭示了SLC16A11基因的作用,该基因编码的单羧酸转运蛋白功能受损会导致肝细胞内DAG和甘油三酯(TAG)积聚,与T2D患者的脂质表型一致。另一个重要基因PNPLA3的变异则与肝脏脂肪含量、代谢功能障碍相关脂肪肝病(MASLD)和T2D风险相关,其编码的蛋白参与脂滴动员。然而,由于PNPLA3在脂肪组织中也有表达,精确界定其组织特异性作用仍具挑战性。
脂肪组织不仅是能量储存器官,更是重要的代谢和内分泌器官。遗传学研究不仅将肥胖,更将不利的脂肪分布(内脏脂肪增多而皮下脂肪减少)确立为T2D的独立危险因素。罕见的单基因脂肪营养不良,如由PPARG基因突变引起的家族性部分性脂肪营养不良(FPLD),其病理机制(脂肪生成受损、异位脂肪沉积)与常见变异驱动的T2D亚型存在惊人的相似性。胰岛素刺激的葡萄糖摄取过程在T2D中失调,SLC2A4(编码GLUT4)基因的变异可直接影响其表达。更有研究发现,对多个胰岛素刺激葡萄糖摄取变化(IFC)GWAS位点中的基因进行扰动,会影响GLUT4向细胞表面的转运,例如FLII基因参与肌动蛋白细胞骨架重塑,这揭示了葡萄糖摄取调控的新层面。最近的研究还发现,GRB14基因座内的非编码变异通过降低COBLL1的表达,损害肌动蛋白组织,从而影响脂肪细胞分化和胰岛素应答。
骨骼肌是重要的胰岛素敏感组织。ANK1位点的研究揭示了V2F研究的复杂性:在肌肉中,风险变异可能影响ANK1(锚蛋白1)的可变剪接,进而影响肌浆网组装和葡萄糖摄取;而在胰腺胰岛中,同一区域的独立遗传信号则可能通过影响NKX6-3转录因子的表达来调节β细胞发育和功能。新兴的单细胞多组学技术正在提升肌肉研究中V2F的分辨率。例如,对大量肌肉样本的单核分析揭示了细胞类型特异性的表达数量性状基因座(eQTL)和染色质可及性数量性状基因座(caQTL),并发现C2CD4A/B位点的变异rs7163757可能通过影响VPS13C基因来调控GLUT4的膜定位。
贝叶斯统计精细定位工具(如SuSiE, CARMA)结合多祖先数据,能够更精确地界定与性状关联的变异集合,优先筛选出可能的因果变异。
整合表观基因组注释(如ENCODE、Roadmap计划产生的染色质可及性、组蛋白修饰数据)是解读非编码变异的关键。QTL分析,特别是eQTL,能将遗传变异与分子表型(如基因表达水平)关联起来。传统的批量组织QTL分析会掩盖细胞异质性,而单细胞QTL作图技术(如使用单细胞RNA测序 scRNA-seq)则能在细胞分辨率下揭示变异效应,发现细胞类型或状态特异性的调控关系。此外,在疾病相关刺激下(如细胞因子、代谢压力)识别响应性eQTL(reQTL),对于理解动态环境中的基因调控至关重要。
机器学习模型(如Enformer, Basset)能够根据DNA序列预测其调控活性。大规模并行报告基因 assay(MPRA)和自转录活性调控区测序(STARR-seq)可用于高通量测试数千个调控元件的活性。CRISPR技术的革命性进展,特别是CRISPR干扰(CRISPRi)、CRISPR激活(CRISPRa)以及碱基编辑,使得能够在基因组原生背景下精确扰动变异或基因。将CRISPR筛选与单细胞多组学读值结合的平台(如Perturb-seq, CROP-seq)能够同时解析遗传扰动的转录组后果。高通量表型分析,如基于成像的细胞形态学分析(LipocyteProfiler)或流式细胞术,能够将遗传变异与脂质积累等疾病相关细胞表型直接联系起来。利用遗传多样性细胞进行“培养皿中的GWAS”以及3D类器官和芯片器官(OoC)模型,为在更接近生理的环境中研究遗传变异提供了可能。
从遗传变异发现到机制阐释的道路虽复杂,但正在被迅速拓宽。整合人工智能与机器学习的V2F研究流程,结合不断扩展的多祖先数据集和先进的实验系统,不仅有望彻底解析T2D的致病通路,更将推动针对个体遗传和分子谱的精准治疗策略的发展,最终改善全球T2D患者的预后。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号