
-
生物通官微
陪你抓住生命科技
跳动的脉搏
"DiabetesOmic:首个整合多组学与单细胞测序的糖尿病综合数据库揭示疾病分子机制"
【字体: 大 中 小 】 时间:2025年05月12日 来源:Computational and Structural Biotechnology Journal 4.5
编辑推荐:
为解决糖尿病分子机制研究缺乏多组学整合资源的问题,研究人员开发了首个全面整合ChIP-seq、RNA-seq、ATAC-seq及单细胞测序(scRNA-seq/scATAC-seq)的糖尿病多组学数据库DiabetesOmic。该数据库系统分析了487例样本的转录调控网络、表观遗传修饰和细胞异质性,揭示了糖尿病及其并发症的关键分子特征,为疾病机制研究和精准治疗提供了重要工具。
糖尿病作为全球最常见的代谢性疾病,其复杂的发病机制涉及遗传、表观遗传和细胞异质性等多层次调控。尽管高通量测序技术已广泛应用于糖尿病研究,但现有数据库如T1DBase和T2D-Db仍存在显著局限:缺乏单细胞分辨率数据、多组学整合不足、临床并发症注释不完善。这导致研究者难以系统解析糖尿病中细胞特异性调控机制和动态变化过程。
为解决这一关键问题,南华大学等机构的研究团队构建了DiabetesOmic——全球首个全面整合五大多组学测序技术(ChIP-seq、RNA-seq、ATAC-seq、scATAC-seq和scRNA-seq)的糖尿病综合数据库。该研究通过系统分析487例跨物种样本(涵盖T1D、T2D及并发症),揭示了从表观修饰到单细胞转录的分子网络特征,相关成果发表在《Computational and Structural Biotechnology Journal》。
研究团队采用标准化生物信息学流程处理多组学数据:从NCBI SRA数据库获取原始测序数据后,分别使用Bowtie2/MACS2分析ChIP-seq的转录因子结合位点和组蛋白修饰(如H3K27ac);通过Seurat和Harmony整合scRNA-seq数据解析细胞异质性;应用Signac和ChromVAR挖掘scATAC-seq的染色质开放状态及转录因子活性。所有数据均经过严格质控,并关联临床并发症注释。
研究结果部分:
数据整合与质量控制
数据库整合486个样本(280例T1D/206例T2D),覆盖胰岛、肝脏等多组织来源。单细胞数据通过SCINA算法注释出α/β细胞等11类亚群,质量控制显示线粒体基因占比<10%。
转录调控网络特征
ChIP-seq分析发现MAFA、PDX1等关键转录因子(TF)在糖尿病β细胞中结合位点显著改变(p<0.01)。H3K27ac修饰鉴定的超级增强子(SE)与糖尿病肾病相关基因如COL4A1存在共定位。
单细胞分辨率发现
scRNA-seq揭示β细胞特异性表达MAFA(p=8.6×10-204),其调控网络包含PDX1等发育相关TF。scATAC-seq进一步验证MAFA启动子区在β细胞的特异性开放(p=1.7×10-51)。
表观遗传与通路关联
ATAC-seq差异峰关联基因富集于胰岛素分泌通路(FDR<0.05)。组蛋白修饰H3K4me3在糖尿病内皮细胞中广泛重编程,提示表观调控参与血管并发症。
讨论指出,DiabetesOmic首次实现从bulk到单细胞、从基因表达到染色质状态的多维数据整合,其特色在于:① 纳入scATAC-seq揭示染色质动态;② 人工标注糖尿病肾病等并发症临床数据;③ 开发在线工具支持用户自定义基因集富集分析。相比T2DKP等传统数据库,该资源将糖尿病研究分辨率提升至单细胞水平,为发现细胞类型特异性靶点(如β细胞中的MAFA-PDX1模块)提供全新视角。
未来计划扩展器官类器官和空间转录组数据,并开发基因组浏览器交互界面。该数据库已开源所有处理代码和分析结果,将成为糖尿病机制研究和精准医学的重要基础设施。