动脉粥样硬化-肿瘤学视角:利用机器学习识别用于动脉粥样硬化诊断的关键基因

《Frontiers in Immunology》:Athero-oncology perspective: identifying hub genes for atherosclerosis diagnosis using machine learning

【字体: 时间:2025年11月05日 来源:Frontiers in Immunology 5.9

编辑推荐:

  动脉粥样硬化(AS)与癌症存在“athero-oncology”生物学机制相似性,本研究通过整合癌症基因集、单细胞测序及机器学习,鉴定出四个关键癌症相关基因(CRGs):IRF7、FHOD1、TNF和ZSWIM3。利用SVM-RFE、LASSO回归和随机森林算法筛选出IRF7、FHOD1和TNF作为核心诊断标志物,构建的 nomogram在多个验证数据集中表现出高AUC(0.819-0.995),且与免疫细胞浸润(如巨噬细胞)及SMC表型转换显著相关。

在心血管疾病领域,动脉粥样硬化(Atherosclerosis, AS)作为一种慢性炎症性疾病,是全球范围内导致发病率和死亡率的主要原因之一。其核心特征包括动脉壁的逐渐狭窄、血栓形成以及不稳定斑块的破裂或侵蚀,最终可能引发严重的心血管事件,如心肌梗死或脑卒中。随着对AS病理机制研究的深入,研究者逐渐发现,其发展过程中存在与癌症高度相似的生物学特征,这种现象被称为“动脉肿瘤学”(Athero-oncology)。本文探讨了AS中平滑肌细胞(Smooth Muscle Cells, SMCs)向其他表型转化的机制,并结合癌症相关基因集,通过生物信息学与机器学习技术,识别出关键的枢纽基因,为AS的早期诊断和治疗提供新的思路。

### 一、研究背景与意义

动脉粥样硬化是一种复杂的多因素疾病,其发生与遗传、环境、代谢异常以及免疫反应密切相关。近年来,越来越多的研究揭示了AS与癌症之间的分子机制相似性。例如,SMCs在动脉粥样硬化病变中表现出类似于癌细胞的特性,如基因组不稳定性、异常增殖和致癌通路的激活。这些发现不仅加深了对AS病理机制的理解,也为开发新的诊断工具和治疗策略提供了理论依据。本研究旨在通过整合癌症基因集,结合生物信息学方法,识别与AS相关的关键基因,并探索其在免疫微环境中的作用,从而揭示AS的潜在分子机制和治疗靶点。

### 二、研究方法与技术路线

本研究采用了多种先进的生物信息学和分子生物学方法,以系统分析AS的基因表达特征和免疫微环境变化。首先,研究者从NCBI的Gene Expression Omnibus(GEO)数据库中获取了多个微阵列和单细胞RNA测序(scRNA-seq)数据集,包括GSE100927、GSE43292、GSE159677、GSE28829和GSE155514。这些数据集涵盖了人类和小鼠的AS样本,为跨物种比较提供了可能性。

为了识别差异表达基因(Differentially Expressed Genes, DEGs),研究团队使用了Limma软件包进行统计分析,结合Benjamini-Hochberg方法对结果进行多重假设校正,筛选出具有显著差异表达的基因。随后,研究者利用加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis, WGCNA)方法,对基因间的相互作用进行了深入分析,识别出与AS表型高度相关的基因模块。通过这一过程,研究团队筛选出多个与AS相关的候选基因,进一步结合癌症相关基因集,确定了与AS共有的214个关键基因。

为了更精准地识别AS的枢纽基因,研究者采用了一种机器学习方法,包括支持向量机递归特征消除(SVM-RFE)、LASSO回归和随机森林算法。这些方法不仅能够处理高维基因表达数据,还能有效筛选出对疾病诊断具有重要意义的基因。最终,研究团队通过这些方法的交叉分析,确定了四个关键的癌症相关枢纽基因:干扰素调节因子7(IRF7)、成形素同源结构域2含1(FHOD1)、肿瘤坏死因子(TNF)和锌指SWIM结构域含3(ZSWIM3)。这些基因的表达模式在AS样本中显著上调,可能在疾病进展中发挥关键作用。

此外,为了评估这些基因在AS诊断中的应用价值,研究团队构建了一个基于这些基因的诊断模型——诺模图(Nomogram)。诺模图是一种图形化工具,能够将复杂的基因表达数据转化为直观的临床评分系统,帮助医生评估患者的疾病风险。通过计算曲线下面积(Area Under the Curve, AUC)和精确-召回(Precision-Recall, PR)曲线,研究团队验证了该模型在训练集和验证集中的诊断性能,结果表明该模型在多个数据集中均表现出较高的准确性。

### 三、研究结果与发现

通过分析AS和对照组的基因表达差异,研究团队发现AS病变中存在显著的免疫细胞浸润和炎症相关通路的激活。具体而言,在GSE100927数据集中,AS组与对照组的基因表达差异被显著富集在包括“同种异体移植排斥反应”、“类风湿性关节炎”、“溶酶体”、“吞噬体”等与炎症相关的通路中。同时,一些与心肌收缩、细胞骨架调控和血管平滑肌收缩相关的通路则在AS组中被显著下调。这些结果表明,AS的病理过程与免疫系统和炎症反应密切相关。

在单细胞RNA测序分析中,研究团队进一步揭示了SMCs在AS发展过程中的动态变化。他们发现,在AS进展过程中,SMCs不仅经历了表型转化,还逐渐分化为具有吞噬功能的巨噬细胞样细胞(MACs)。这些MACs表现出与癌症相关的特征,如高表达IRF7和FHOD1,这可能意味着这些基因在AS中与SMCs向MACs的转化密切相关。此外,研究团队通过免疫荧光染色技术验证了这些基因在人类和小鼠AS样本中的表达情况,发现它们在CD68阳性巨噬细胞中显著上调,进一步支持了它们在AS中的关键作用。

### 四、研究结论与展望

本研究的结果表明,通过整合癌症基因集和AS相关数据,可以识别出与AS进展密切相关的枢纽基因,如IRF7、FHOD1、TNF和ZSWIM3。这些基因不仅在AS的诊断中表现出较高的准确性和可靠性,还可能通过调节免疫微环境和SMCs的表型转化,影响AS的病理进程。特别是IRF7和FHOD1的表达与巨噬细胞的浸润和功能变化相关,提示它们在AS的免疫调控中可能发挥重要作用。

此外,研究团队还发现,基于这些基因的诺模图在多个数据集中均表现出优异的诊断性能,AUC值高达0.995,说明该模型在预测AS风险方面具有良好的应用前景。然而,尽管这些发现具有重要的临床意义,研究团队也指出了一些局限性。例如,目前的研究主要基于小鼠模型和公共数据库的数据,缺乏对人类样本的直接验证,因此未来的研究需要进一步在临床样本中进行验证。同时,研究团队建议使用空间转录组学或多重离子束成像(Multiplexed Ion Beam Imaging, MIBI)等技术,以更精确地确定IRF7和FHOD1在AS病变中的空间分布和细胞特异性表达模式。

### 五、研究的科学意义与应用价值

本研究的创新之处在于,它将癌症相关的分子机制与AS的病理过程相结合,为理解AS的复杂生物学特征提供了新的视角。通过整合癌症基因集,研究团队不仅识别出与AS相关的基因,还揭示了这些基因在免疫微环境中的作用。这种跨学科的研究方法为AS的早期诊断和干预提供了新的工具,同时也为开发针对SMCs转化和免疫调节的治疗策略奠定了基础。

此外,研究团队发现,一些已用于癌症治疗的药物,如PARP抑制剂尼拉帕利(Niraparib),在AS小鼠模型中也表现出一定的治疗效果。这一发现进一步支持了“动脉肿瘤学”概念的科学性,并为未来将癌症治疗策略应用于AS提供了可能的方向。例如,通过靶向SMCs的异常增殖和免疫逃逸,可能可以有效抑制AS的进展,减少心血管事件的发生。

综上所述,本研究通过多组学分析和机器学习方法,揭示了AS中关键基因与免疫微环境之间的复杂关系,为理解AS的发病机制和开发新的诊断与治疗策略提供了重要的理论依据和实验支持。然而,为了进一步验证这些基因在AS中的功能,还需要开展更多的体内和体外实验,以明确它们在斑块形成、病变进展和稳定性中的具体作用。未来的研究可以围绕这些基因的分子机制、与其他病理过程的相互作用以及在临床中的应用展开,从而推动AS的精准医学研究向前发展。

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号