基于34个mRNA标记的年龄预测模型构建与验证研究

【字体: 时间:2025年10月12日 来源:Forensic Science International: Digital Investigation 2.0

编辑推荐:

  本文通过RNA测序技术分析中国人群外周血转录组数据,首次鉴定出7个新型年龄相关基因(ARGs),并采用弹性网络(Elastic Net)等机器学习算法构建年龄预测模型。模型在测试集、内部验证集和外部验证集(GSE262619、GSE124326)的MAE分别为6.72年、7.56年和11.74年,为法医学和衰老研究提供了高稳健性的mRNA生物标志物(biomarker)解决方案。

  
研究亮点
与年龄相关的基因表达变化凸显了其在年龄预测中的潜力[42]。尽管已有多种模型利用大量基因集进行开发,但仍需进一步研究以识别高度年龄相关的标志物,并检验其在中国人群中的有效性。通过利用源自外周血的RNA测序数据,我们全面表征了与年龄相关的转录组变化,并开发了新型年龄预测模型。
跨年轻(<30岁)、中年(30~60岁)和老年(>60岁)组的差异表达(DE)分析揭示了79个差异表达基因(DEGs)。京都基因与基因组百科全书(KEGG)和基因本体论(GO)富集分析表明,这些DEGs主要参与I型干扰素应答和细胞间粘附过程,这可能反映了与衰老相关的促炎反应激活和神经退行性变化。通过Spearman相关分析和LASSO回归方法,筛选出34个候选年龄相关基因(ARGs)作为预测特征。值得注意的是,其中7个mRNA(ARHGEF4、ARF6、AMIGO1、FITM2、PLEKHG4、SLC5A10和HKR1)是首次被鉴定为ARGs。随后使用五种机器学习算法构建年龄预测模型,训练集与测试集按7:3划分。使用来自同一队列的20个样本进行内部验证,同时使用两个独立数据集(GSE262619和GSE124326)进行外部验证。其中,弹性网络(Elastic Net)模型表现出最佳性能,在测试集上的平均绝对误差(MAE)为6.72年,在内部验证集上为7.56年,在外部验证集上为11.74年,展现了其在年龄预测方面的强大稳健性。
结论
本研究利用127名个体的外周血mRNA数据表征了与年龄相关的基因表达谱。差异表达基因(DEGs),包括ROBO1、NRCAM和PCDHG基因家族,在神经元和炎症通路中富集,支持了神经退行性变和慢性炎症在衰老过程中的作用。共鉴定出34个年龄相关基因(ARGs),包括7个可能对中国人群特异的新型生物标志物。据我们所知,该弹性网络(EN)模型基于最少的34个mRNA标记集,展现出了强大而准确的预测能力。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号