肥厚性瘢痕中的免疫相关炎症基因:通过集成机器学习与WGCNA分析揭示的预后及分子机制

《Frontiers in Immunology》:Immune-related inflammatory gene in hypertrophic scar: prognostic and molecular mechanisms via integrated machine learning-WGCNA analysis

【字体: 时间:2025年10月28日 来源:Frontiers in Immunology 5.9

编辑推荐:

  基因表达谱整合与机器学习筛选出COL1A1、A2M、TIMP1、COL1A2四项免疫炎症相关标志基因,构建基于纤维化微环境的nomogram模型,并通过qRT-PCR和Western blot验证其在HTS诊断中的可靠性,并揭示COL1A1调控纤维母细胞增殖与凋亡的双向作用机制。

  这项研究聚焦于探索与肥厚性瘢痕(HTS)相关的免疫相关炎症基因及其分子机制,旨在为疾病的预后和诊断提供新的视角。HTS是一种常见的皮肤纤维化疾病,通常由创伤、手术或烧伤引发,其特点是皮肤组织过度增殖和异常胶原沉积。尽管HTS不会直接危及生命,但它可能导致功能障碍和显著的心理压力。目前,预防HTS比治疗更为有效,而可靠的生物标志物对于早期识别和预测HTS具有重要意义,可以显著影响疾病的整体预后。

HTS的发病机制复杂,涉及多种细胞类型和分子通路,特别是免疫-炎症反应的失调。例如,促纤维化免疫细胞(如M2巨噬细胞、树突状细胞、肥大细胞和Th2细胞)的异常积累,通过转化生长因子-β1(TGF-β1)信号通路诱导成纤维细胞向肌成纤维细胞转化。此外,炎症强度与最终瘢痕大小呈正相关,表明免疫-炎症反应在HTS的形成和进展中起着关键作用。已有研究表明,在HTS组织中存在显著的免疫细胞浸润和炎症因子上调,提示免疫微环境的失调可能是HTS发病的核心驱动因素。例如,T细胞和B细胞在HTS组织中的异常聚集已被广泛报道,这些细胞通过释放促炎因子和生长因子促进成纤维细胞的激活和胶原过度沉积。此外,炎症相关信号通路如NF-κB的异常激活也被认为是HTS形成的重要机制。目前,尽管免疫相关炎症生物标志物的应用引起了广泛关注,但大多数研究存在样本量小和方法学限制等问题。

为了系统识别和验证HTS中的免疫相关炎症生物标志物,本研究采用了多种机器学习算法,并结合生物信息学分析和实验验证。同时,这些生物标志物的功能将在体外实验中进行验证,以期为HTS的管理提供新的见解和潜在的治疗靶点。研究过程包括数据获取、预处理、差异表达分析、基因集富集分析(GSEA)、免疫浸润分析、模块化分析、交叉基因筛选、功能富集分析、蛋白-蛋白相互作用(PPI)网络构建、机器学习模型训练、签名基因筛选、预测模型构建以及临床验证等多个步骤。

在数据预处理阶段,研究人员从公共的GEO数据库中获取了与HTS相关的基因表达数据。经过背景校正、标准化和log2转换等步骤,消除了技术噪声,提高了数据的可比性和分析的可靠性。此外,对多探针对应同一基因的情况进行了平均表达值计算,并剔除了无法匹配基因符号的探针。对于缺失值的处理,采用了k-最近邻(KNN)插补方法,以减少数据缺失带来的干扰。如果数据来自多个实验批次,则使用ComBat方法进行批次效应校正,以提高数据的一致性。最后,通过低表达基因过滤,剔除了在超过80%的样本中表达值处于最低25百分位的基因,以减少低信息特征对分析的干扰。

差异表达分析(DEGs)结果显示,在HTS与正常样本之间共鉴定出2244个差异表达基因,包括1249个上调基因和995个下调基因。GSEA分析进一步揭示了与HTS相关的显著通路,包括免疫反应、炎症过程和代谢调节等,表明这些通路可能在HTS的发病机制中发挥重要作用。免疫浸润分析则显示,HTS组织中存在25种显著差异浸润的免疫细胞,如活化的B细胞等,这些细胞的浸润程度显著高于正常组织。同时,相关性分析显示,大多数免疫细胞类型之间存在显著的正相关,提示在组织微环境中存在协调的免疫反应。

为了进一步挖掘与HTS相关的基因模块,研究采用了加权基因共表达网络分析(WGCNA)方法。首先,对HTS样本的表达矩阵进行了方差分析,筛选出5000个最可变的基因。接着,通过WGCNA构建基因共表达网络,将高维转录组数据转化为基因模块,揭示具有相似表达模式的基因簇及其潜在的生物学功能。WGCNA还能够直接分析基因模块与表型之间的相关性,从而识别与免疫细胞显著相关的基因组。此外,WGCNA通过模块分析减少了统计检验的数量,提高了结果的稳健性。该方法特别适用于大规模数据,即使在对5000个基因进行聚类时,也能保持较高的计算效率和可解释性。

在WGCNA分析中,首先采用软阈值方法将邻接矩阵转化为连续范围,以确保网络符合幂律分布,更符合生物网络的特征。模块选择遵循以下标准:首先,通过pickSoftThreshold函数确定软阈值(β),选择使网络接近无标度拓扑结构的最小β值(通常R2 ≥ 0.85);其次,设定最小模块大小为100个基因,以避免因模块过小导致的统计不稳定性;最后,计算每个模块特征基因与免疫细胞之间的相关性,并筛选出相关性绝对值≥0.75且p值<0.05的模块用于后续分析。通过blockwiseModules函数生成无标度网络,并进行模块划分分析。对于每个模块,计算模块成员和基因显著性。

为了识别与HTS相关的免疫-炎症基因,研究进一步结合了差异表达基因、WGCNA模块基因和炎症相关基因。通过韦恩图分析,共筛选出73个共同基因,这些基因被认为是与HTS相关的交叉基因。接下来,对交叉基因进行了功能富集分析和相互作用分析。基因本体(GO)和KEGG通路分析显示,这些基因主要富集于免疫反应调节、蛋白酶结合和胶原相关细胞外基质(ECM)等生物学过程和功能。蛋白-蛋白相互作用(PPI)分析构建了一个包含63个节点和254个相互作用的网络,进一步揭示了这些基因之间的潜在相互作用。通过MCC、MNC、EPC和Degree等拓扑算法,研究识别了30个关键基因,这些基因在PPI网络中被优先考虑。

为了筛选出签名基因,研究采用了三种先进的机器学习算法,包括LASSO回归、支持向量机(SVM)和随机森林(RF)。LASSO回归通过压缩部分回归系数为零,实现自动特征选择,有效减少冗余变量并缓解多重共线性的影响。SVM-RFE方法通过递归特征消除技术,筛选出7个显著基因。RF算法则通过MeanDecreaseGini阈值筛选出前六个基因。三种方法的交叉筛选结果最终确定了四个签名基因:A2M、COL1A1、COL1A2和TIMP1。这些签名基因在后续的分析中被用于验证其在HTS中的预后价值。

签名基因的评估分析显示,这些基因在HTS组与正常组之间表现出显著的上调趋势,并且在训练数据集中,ROC分析表明每个基因的AUC值均大于0.982,显示出良好的预测性能。此外,验证数据集的分析进一步确认了这些结果,表明签名基因在HTS中的表达差异具有统计学意义。通过构建一个基于签名基因的列线图(nomogram),研究还评估了其在临床诊断中的应用价值。列线图通过将多个基因的表达信息转化为评分,能够有效预测HTS的风险。校准曲线、决策曲线和临床曲线的分析显示,列线图在预测HTS风险方面的误差极小,表明其具有较高的预测准确性。

为了进一步探索签名基因的功能,研究利用GeneMANIA数据库构建了基因-基因相互作用网络,显示签名基因与20个具有显著关联的基因之间存在潜在的相互作用,提示这些基因可能在调控和功能上具有联系。基于DSigDB数据库,研究还识别了签名基因及其相关的靶向药物。例如,苯二氮?类药物和钛化合物显示出与签名基因的强关联,表明它们可能具有潜在的治疗意义。此外,GSEA分析显示,所有签名基因均富集于细胞外基质(ECM)受体相互作用和核糖体等通路,进一步支持这些基因在HTS中的重要作用。免疫相关性分析表明,签名基因与自然杀伤T细胞等免疫细胞之间存在显著相关性,提示这些基因可能在调控免疫微环境方面发挥关键作用。

为了验证签名基因在HTS组织与正常皮肤组织中的表达差异,研究采用qRT-PCR和Western blot方法对12例HTS组织和正常皮肤组织进行了分析。结果显示,与正常组织相比,HTS组织中A2M、COL1A1、COL1A2和TIMP1的表达水平显著上调(p值<0.001)。Western blot分析进一步确认了这些基因在蛋白质水平上的表达差异。此外,通过siRNA转染HTS成纤维细胞,研究验证了COL1A1的敲低效果。结果显示,与阴性对照组相比,si-COL1A1显著降低了COL1A1的mRNA表达,从而抑制了成纤维细胞的增殖并促进了细胞凋亡,表明COL1A1在促进成纤维细胞增殖和抑制凋亡方面具有重要作用。

研究还通过CCK-8实验检测了COL1A1敲低对成纤维细胞增殖的影响。结果显示,敲低COL1A1显著抑制了成纤维细胞的增殖,且其增殖率明显低于阴性对照组。此外,通过流式细胞术检测了COL1A1敲低对细胞凋亡的影响,结果显示,与阴性对照组相比,敲低COL1A1显著增加了凋亡细胞的比例,表明COL1A1在HTS成纤维细胞中具有抗凋亡作用。这些结果进一步支持了COL1A1在促进瘢痕形成中的关键角色。

研究还探讨了其他签名基因的功能。例如,A2M作为一种多功能蛋白酶抑制剂和急性期反应蛋白,参与免疫调节、细胞因子滞留和炎症消退。在HTS中,A2M表达的减少可能影响其免疫抑制功能,进而加剧炎症反应和成纤维细胞的激活。TIMP1作为一种蛋白酶抑制剂,通过抑制基质金属蛋白酶(MMPs)来调节ECM的降解。研究发现,TIMP1的表达水平在HTS中显著升高,可能通过破坏MMP-TIMP平衡,导致ECM的异常积累。此外,TIMP1还可能通过与多种共受体和细胞表面受体(如CD74、LRP1和CD63)相互作用,发挥免疫相关功能。

COL1A2作为I型胶原α2链的编码基因,是维持皮肤张力的关键成分。研究发现,COL1A2的表达水平在HTS中显著升高,可能通过促进ECM的异常积累,进而推动瘢痕的形成。此外,COL1A2与COL1A1协同作用,促进胶原合成并驱动纤维化瘢痕的形成。这些发现不仅揭示了HTS的关键分子机制,还为临床治疗提供了潜在的药物靶点。

研究还构建了一个基于核心基因的列线图模型,该模型能够有效预测HTS的发生风险。作为直观的预测工具,列线图在多种疾病的临床诊断中被广泛应用。然而,目前列线图在HTS中的应用较为有限。本研究通过整合多个基因的表达信息,构建了一个具有高预测准确性的列线图模型。模型的预测性能通过校准曲线和决策曲线分析进行了验证,表明其在HTS早期诊断中的应用潜力。

尽管本研究取得了显著成果,但仍存在一些局限性。首先,验证阶段的样本量相对较小。虽然qRT-PCR、Western blot和细胞实验验证了签名基因的表达差异及其功能,但有限的HTS患者组织样本和成纤维细胞数量可能限制了研究结果的普遍适用性,未能充分反映不同人群或HTS临床亚型的异质性。其次,研究主要依赖于GEO数据库中的公共微阵列数据,这些数据可能受到批次效应、预处理协议差异和临床元数据不完整的影响,可能导致签名基因和相关机制的偏差。此外,列线图的泛化能力在不同种族和瘢痕亚型中的表现尚不清楚。这些局限性提示未来需要更大规模的多中心验证队列和整合内部测序数据,以进一步验证研究结论。

综上所述,本研究成功识别了四个与HTS相关的免疫相关炎症生物标志物,并构建了一个用于临床诊断的列线图模型。这些发现不仅为HTS的发病机制提供了新的见解,还为潜在的治疗策略提供了参考。未来的研究需要在样本量和数据多样性方面进一步拓展,以提高模型的泛化能力和临床适用性。同时,探索更多与免疫和炎症相关的基因及药物靶点,将有助于推动HTS的个性化治疗和精准诊断,为患者提供更有效的干预手段。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号