编辑推荐:
脓毒症死亡率高,发病机制不明。研究人员开展 “Integrating bioinformatics and machine learning to discover sumoylation associated signatures in sepsis” 主题研究。结果发现 6 个与 SUMO 化相关的枢纽基因,对脓毒症诊断有重要意义,为脓毒症诊疗提供新方向。
脓毒症,这个潜藏在人体健康暗处的 “杀手”,时刻威胁着人们的生命安全。它是由细菌感染引发的危及生命的全身性炎症综合征,每年在全球范围内导致大量人口死亡。尽管医疗技术不断进步,抗生素、液体复苏和多器官支持等治疗手段广泛应用,但脓毒症患者的预后依旧不容乐观。目前,人们对脓毒症的发病机制了解有限,缺乏有效的早期诊断生物标志物,这使得及时治疗和改善患者预后困难重重。因此,深入探究脓毒症的发病机制,寻找精准诊断的生物标志物,成为医学领域亟待攻克的难题。
在这样的背景下,来自黑龙江省医院麻醉科、哈尔滨医科大学附属肿瘤医院结直肠外科、黑龙江省医院重症医学科以及哈尔滨医科大学附属第二医院麻醉科等机构的研究人员,开展了一项极具意义的研究。他们通过整合生物信息学和机器学习技术,深入挖掘脓毒症中与 Small Ubiquitin - like MOdifier 介导的修饰(SUMOylation,一种重要的蛋白质翻译后修饰过程,可调节靶蛋白的定位和功能 )相关的特征。该研究成果发表在《Scientific Reports》上,为脓毒症的诊疗带来了新的曙光。
研究人员为开展此项研究,采用了多种关键技术方法。首先,从公共数据库 Gene Expression Omnibus(GEO)中获取了 GSE65682、GSE95233 等多个数据集,这些数据集包含了大量脓毒症患者和健康对照的血液样本信息。接着,运用 limma 软件包进行差异分析,筛选出脓毒症与对照组之间的差异表达基因(Differentially expressed genes,DEGs) 。利用 Weighted Gene Co - expression Network Analysis(WGCNA,加权基因共表达网络分析,可用于识别与特定性状相关的基因模块 )构建基因共表达网络,找出关键模块基因。通过将 DEGs、关键模块基因与 SUMOylation 相关基因(SUMO - RGs)取交集,得到候选基因。然后,借助 Least Absolute Shrinkage and Selection Operator(LASSO,最小绝对收缩和选择算子,能在高维数据中进行特征选择和模型训练 )和 Support Vector Machine - Recursive Feature Elimination(SVM - RFE,支持向量机递归特征消除,可迭代消除不重要的特征 )两种机器学习算法,确定了关键特征基因。最后,对这些基因进行诊断分析、表达验证以及功能和通路富集分析等,全面探究其在脓毒症中的作用。
下面来详细了解一下研究结果:
- 差异基因和共表达模块的识别与分析:在 GSE65682 数据集中,研究人员共鉴定出 3889 个 DEGs,其中 1268 个上调,2631 个下调。通过聚类分析发现样本中无异常值。确定最优软阈值 β 为 12 后,构建共表达网络,识别出 11 个共表达模块,其中绿色模块与脓毒症关联最强,包含 638 个基因。
- 候选基因的功能分析和蛋白质 - 蛋白质相互作用:整合 DEGs、关键模块基因和 SUMO - RGs 的交集,得到 8 个候选基因。GO 和 KEGG 分析显示,候选基因主要富集在核转运、DNA 复制、昼夜节律等功能和通路。蛋白质 - 蛋白质相互作用(Protein - protein interaction,PPI)网络分析表明,RANGAP1 与 NUP188、NUP210 或 L3MBTL2 之间的相互作用频率最高。
- 机器学习算法识别候选枢纽基因:LASSO 算法筛选出 7 个候选基因,SVM - RFE 算法筛选出 6 个特征基因,两者交集得到 6 个候选枢纽基因:RORA、L3MBTL2、PHC1、RPA1、CHD3 和 RANGAP1。
- 枢纽基因及其潜在相互作用:对候选枢纽基因进行诊断分析,其受试者工作特征(Receiver operating characteristic,ROC)曲线下面积(Area under the curve,AUC)均大于 0.7,且在脓毒症中显著下调,因此被确定为枢纽基因。这些基因在染色体上的位置各异,同时构建的基因 - 基因相互作用(Gene - gene interaction,GGI)网络预测了它们与其他基因的潜在相互作用。
- 枢纽基因参与的脓毒症相关通路:基因集富集分析(Gene Set Enrichment Analysis,GSEA)表明,这 6 个枢纽基因与核糖体、自身免疫性甲状腺疾病和剪接体等通路相关。
- 免疫细胞组成和相关性分析:对训练集中的免疫细胞进行分析,发现脓毒症与对照组中多种免疫细胞比例存在差异。相关性分析显示,效应记忆 CD8+T 细胞与活化 CD8+T 细胞呈显著正相关,活化 CD8+T 细胞与 RORA 的正相关性最强,而 RORA 与活化树突状细胞、RANGAP1 与巨噬细胞呈负相关。
- 枢纽基因的亚细胞定位分析:亚细胞定位分析表明,这些枢纽基因主要定位于细胞核,RPA1 和 CHD3 还定位于 PML 体。
- 调控网络和潜在治疗药物:预测与枢纽基因相关的 miRNA 和 lncRNA,构建了 lncRNA - miRNA - mRNA 调控网络,发现 AC004687.1 和 MALAT1 分别通过 hsa - miR - 142 - 5p 和 hsa - miR - 346 调节 PHC1 表达。基于 CTD 数据库预测,黄曲霉毒素 B1 可能是治疗脓毒症的潜在药物。
研究结论和讨论部分指出,本研究确定的 6 个枢纽基因对脓毒症诊断具有重要意义,可能作为潜在的生物标志物,为脓毒症的早期诊断和治疗监测提供依据。这些基因参与了脓毒症的多种病理过程,如免疫细胞功能调节、昼夜节律紊乱等,为深入理解脓毒症的发病机制提供了新视角。同时,研究还发现了一些潜在的治疗靶点和药物,为开发脓毒症的靶向治疗提供了方向。然而,该研究也存在一定局限性,如采用的技术方法相对传统,缺乏足够的蛋白质组学和代谢组学数据,且实验验证不足。未来研究可运用先进的多组学整合工具,扩大样本量,加强实验验证,进一步完善对脓毒症的研究。
总之,这项研究在脓毒症的诊疗研究道路上迈出了重要一步,为后续研究提供了宝贵的参考,有望推动脓毒症诊疗技术的发展,改善患者的预后。