
-
生物通官微
陪你抓住生命科技
跳动的脉搏
"MethAgingDB:首个跨物种跨组织的DNA甲基化衰老生物学综合数据库"
【字体: 大 中 小 】 时间:2025年07月15日 来源:Scientific Data 5.8
编辑推荐:
本研究团队针对衰老生物学研究中缺乏标准化DNA甲基化数据库的瓶颈问题,开发了首个整合人类和小鼠多组织甲基化图谱的MethAgingDB。该数据库收录93个数据集共12835个样本,提供预处理矩阵、组织特异性DMSs/DMRs及42种表观遗传时钟工具,解决了数据格式混乱、注释不一致等难题,为衰老机制研究和生物标志物开发提供重要资源。
随着全球老龄化进程加速,到205年65岁以上人口预计达16亿,准确量化生物年龄成为理解衰老机制的关键。然而当前研究面临三大困境:分散在公共数据库的甲基化数据格式混乱,缺乏统一注释标准;衰老相关差异甲基化位点(DMSs)和区域(DMRs)缺乏系统整理;表观遗传时钟工具激增却难以横向比较。这些问题严重阻碍了衰老标志物的开发和机制研究。
南开大学数学科学学院和LPMC的研究团队通过整合93个数据集、12835个人类和小鼠样本,构建了首个跨物种跨组织的DNA甲基化衰老数据库MethAgingDB。该成果发表于《Scientific Data》,涵盖13种人类组织和9种小鼠组织,首次实现从原始IDAT文件到标准化β值矩阵的一站式处理,并系统鉴定出组织特异性DMSs/DMRs,同时收录42种表观遗传时钟工具的比较信息。
关键技术包括:1)采用ChAMP工具处理450K/EPIC芯片数据,保留原始β值矩阵;2)基于limma和Bumphunter算法鉴定DMSs/DMRs;3)通过GO和KEGG分析验证生物学功能;4)建立机器学习模型评估数据质量。所有数据均映射至hg19/mm10参考基因组,年龄分组采用人类20年间隔和小鼠3月间隔的标准。
【数据收集】整合93个GEO数据集,包含11474个人类样本和1361个小鼠样本,覆盖从儿童到老年的全年龄段。人类样本以血液为主(占81.6%),小鼠样本涵盖脂肪、肝脏等多组织。
【技术验证】通过性别预测模型验证数据质量,随机森林模型在GSE125105等数据集准确率达0.97。DMSs相关基因显著富集于神经发育(如EPHA5)和细胞外基质通路,证实数据的生物学相关性。
【数据库功能】提供四大核心模块:1)标准化β值矩阵;2)年龄分组特异性DMSs/DMRs;3)基因注释信息(如RNF39相关位点);4)表观时钟工具库,涵盖Horvath时钟等经典模型。
该研究创建了目前最全面的衰老甲基化资源平台,其创新性体现在三方面:首次实现跨平台数据标准化处理,解决450K与EPIC芯片的技术偏差;开发动态年龄分组策略,捕捉不同生命阶段的甲基化特征;整合实验验证与生物信息分析,确保数据的可靠性。未来可通过纳入单细胞测序数据和表观遗传干预实验,进一步拓展其在精准抗衰老研究中的应用价值。
生物通微信公众号
知名企业招聘