
-
生物通官微
陪你抓住生命科技
跳动的脉搏
"细胞状态视差"揭示非编码位点与基因的因果调控机制:GrID-Net在精神分裂症遗传解析中的突破
【字体: 大 中 小 】 时间:2025年08月31日 来源:Nature Communications 15.7
编辑推荐:
本研究针对GWAS(全基因组关联分析)鉴定的非编码疾病位点与靶基因关联难题,开发了基于图神经网络的GrID-Net算法,创新性提出"细胞状态视差"概念解析单细胞多组学数据中的时滞调控关系。通过分析人类皮质发育数据,成功将36%的精神分裂症(SCZ)风险变异与132个靶基因(如KCNQ2/SLC12A6等钾转运蛋白基因)建立因果联系,揭示转录因子结合破坏是SCZ发病的重要机制。该研究为单细胞多组学数据挖掘提供了新范式,发表于《Nature Communications》。
在基因组学的"暗物质"区域,超过90%的疾病相关遗传变异藏身于非编码序列中,如同没有地址的信件,科学家们难以准确投递这些变异与靶基因之间的"调控包裹"。精神分裂症(SCZ)等复杂疾病的治疗长期停滞,正是因为无法破解这些非编码变异如何通过时空特异的调控网络扰乱基因表达。传统方法如最近邻基因假设忽视远端调控,而eQTL(表达数量性状位点)分析需要大样本队列,CRISPR筛选又难以规模化。单细胞多组学技术虽能同时检测染色质可及性(scATAC-seq)和基因表达(scRNA-seq),但现有算法或丢失位点分辨率,或忽略表观-转录的因果时滞。
研究团队受光学视差原理启发,创造性提出"细胞状态视差"概念——就像双镜头手机通过偏移视角感知深度,单细胞多组学中表观组和转录组的测量时间差恰好蕴含因果线索。为捕捉这种动态,团队开发GrID-Net算法,首次将Granger因果推断推广至部分有序系统,通过图神经网络处理单细胞轨迹的有向无环图(DAG)结构。关键技术包括:基于Schema的多组学数据整合构建细胞状态DAG;改进的滞后信息传递机制;结合基因组距离的logistic回归校准;利用神经前体细胞的H3K4me1/H3K27ac组蛋白标记区分 poised/active增强子;整合SCZ患者来源的iPSC(诱导多能干细胞)分化的胶质祖细胞(GPC)转录组验证。
GrID-Net框架优势
算法在4个单细胞多组学数据集上验证,AUROC(受试者工作特征曲线下面积)较传统方法提升7-22%,能准确识别被eQTL和Hi-C数据支持的远端互作。特别在SHARE-seq小鼠皮肤分化数据中,完整DAG结构的分析精度显著高于分支特异性线性Granger检验,证明复杂轨迹需要整体建模。
染色质可及性先导特征
人类皮质发育数据显示,GrID-Net特异性识别的peak-gene对中,poised增强子(仅含H3K4me1)比例是active增强子(含H3K4me1/H3K27ac)的2.3倍。这些位点与神经发生调控基因显著关联,如TRAF1基因上游13.5kb的poised增强子,其可及性变化早于基因表达约4个伪时间单位。
SCZ变异-基因关联拓展
应用GrID-Net解析SCZ GWAS(Trubetskoy et al.)数据,新增30个高置信度(PP>50%)变异注释,包括:
钾通道基因KCNQ2关联6个变异,其中rs8091497使SPI1(小胶质细胞关键TF)结合亲和力降低40倍
rs11799466通过增强ZN281/MAZ等抑制性TF结合,可能下调钾转运蛋白SLC12A6
远端调控案例:ZEB2(距变异137kb)与Mowat-Wilson综合征相关
转录因子调控网络破坏
28个SCZ变异引起TF结合亲和力>20倍变化,涉及:
KLF家族(KLF15/KLF6):神经元生长调控因子结合减弱
SP家族(SP1/SP3):结合增强与患者GPC中靶基因表达变化显著相关(r=0.59)
VEZF1:血管相关TF在5个变异位点结合减弱
共表达模块与通路
SCZ基因模块分析发现:
模块A(SLC12A6/DLX1/DLX2):富集去甲肾上腺素能神经元分化
模块B(MFAP4/STAT6):细胞外基质组织异常
模块C(EPN2/P2RX7):突触传递功能障碍
这项研究通过算法创新将Granger因果推断的应用疆域拓展至图结构动力学系统,首次系统证实非编码变异通过破坏神经特异性TF网络导致SCZ。GrID-Net框架可推广至其他发育疾病研究,其"细胞状态视差"理念为多组学整合提供了新视角。随着单细胞技术发展,该方法有望成为解读非编码基因组功能的金标准,为复杂疾病治疗靶点筛选提供全新路径。
生物通微信公众号
知名企业招聘