帕金森病转录组数据的计算分析及功能网络的绘制
《Frontiers in Bioinformatics》:Computational analysis of transcriptome data and mapping of functional networks in Parkinson’s disease
【字体:
大
中
小
】
时间:2025年11月19日
来源:Frontiers in Bioinformatics 3.9
编辑推荐:
帕金森病(PD)患者与健康对照的外周血RNA-seq数据通过性别和年龄分层分析,结合生物信息学及机器学习(随机森林、XGBoost等),揭示了性别特异性基因表达模式。男性以下调基因为主,女性则呈现免疫相关基因(如IFITM3、SIGLEC1)显著上调。SHAP分析显示不同模型对关键基因(如LFALS2、LRRC37A17P)的重要性排序存在差异,支持PD的性别特异性生物学机制。功能富集分析发现免疫通路、泛素-蛋白酶体系统相关基因(如TUBB8)及铜代谢基因(GPRC5D)与PD病理相关。该框架为血液PD生物标志物开发提供了新思路,并验证了机器学习在复杂疾病分子分型中的应用潜力。
帕金森病(PD)作为最常见的神经退行性运动障碍,其病理机制涉及多巴胺能神经元退化。近年研究聚焦于外周免疫系统在PD发生中的作用,本文基于PPMI项目133 RNA-seq数据,系统分析外周血转录组特征与PD的关联性,并构建多模型机器学习分类框架。研究重点覆盖50-70岁人群,该年龄段PD发病率最高且样本量充足。
在数据预处理阶段,采用AnnData对象整合质量通过样本,基于性别和年龄构建分层分析框架。值得注意的是,样本采集存在两次测序周期差异(2019-2021),但PCA分析显示技术偏差可忽略(图1)。性别差异显著影响基因表达模式:男性呈现普遍下调趋势,仅50-70岁组出现1200+基因上调;女性则保持持续上调态势,尤其在70-80岁组C4BPA基因上调量达2.8倍。年龄分层显示,>80岁组出现RNF182等关键基因深度下调,而50-70岁组因疾病早期症状不明显,上调基因数量达到峰值。
机器学习模型构建采用四类主流算法:逻辑回归、支持向量机(SVM)、随机森林和XGBoost。针对2:1的类别不平衡,引入动态权重调整机制。实验显示随机森林在女性50-70岁组PR-AUC达0.83,XGBoost在男性同年龄段ROC-AUC达0.73。SHAP分析揭示关键生物标志物:女性以SIGLEC1(接头蛋白)、IFITM3(干扰素信号通路)为核心,男性则聚焦于BTNL3(炎症调控)、STK19B(线粒体质量控制)等基因。值得注意的是,LGALS2(糖基化酶)在女性模型中重要性突出,其表达水平与外周免疫活性呈正相关。
功能网络分析显示两大核心机制:免疫应答通路(女性组)和线粒体质量控制通路(男性组)。女性样本中Jak-Stat信号通路富集度达0.008,包含RSAD2、IFI44L等关键基因,这些成分在PD患者中呈现协同下调。男性组则形成以KRT77(角蛋白)为核心的蛋白网络,其表达下调幅度与黑质多巴胺能神经元丢失呈剂量效应关系。特别需要指出的是,虽然网络分析显示LCE1A(角蛋白相关基因)在男性组下调达3.2倍,但现有文献尚未证实其在PD病理中的直接作用,可能存在技术偏差或表观调控机制。
分类模型验证显示,50-70岁男性组XGBoost模型在交叉验证中ROC-AUC稳定在0.71-0.76区间,而女性组随机森林模型PR-AUC达到0.83。SHAP特征重要性分析揭示性别特异性差异:男性模型前三位特征(BTNL3、STK19B、KRT77)均属于炎症调控和细胞骨架系统,女性模型则集中在免疫识别(SIGLEC1)、干扰素信号(IFITM3)和细胞黏附(LCE1A)领域。
生物学验证方面,通过STRING数据库构建的基因互作网络显示,女性组特征基因与MMP9(基质金属蛋白酶9)形成正调控回路,该酶在PD早期病理中具有促炎作用。男性组则形成KRT77-TUBB8(微管蛋白)负反馈环路,与线粒体自噬障碍相关。功能富集分析发现,女性组显著富集干扰素-III通路(p=0.0012),而男性组富集角蛋白相关质膜蛋白合成通路(p=0.0035)。值得注意的是,TUBB8基因在两组中均呈现差异表达,其亚细胞定位提示可能参与神经元轴突运输异常。
该研究创新性体现在:1)首次建立基于性别和年龄分层的动态机器学习模型,2)发现外周血免疫微环境(女性)与细胞骨架异常(男性)的双路径致病机制,3)提出"50-70岁窗口期"的分子分型策略。但研究仍存在局限:1)未纳入PD早期诊断样本,可能影响模型泛化能力;2)角蛋白通路机制尚未通过动物模型验证;3)技术偏差可能影响老年组(>80岁)结果解读。
未来研究方向应聚焦:1)开发基于动态网络模型的早期预警系统;2)构建性别特异性生物标志物组合;3)验证角蛋白-线粒体质量控制通路的分子机制。该研究为外周血PD生物标志物开发提供了重要框架,其多维度分析方法对神经退行性疾病研究具有范式意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号