编辑推荐:
为解决心血管疾病(CVD)治疗难题,研究人员分析脂质代谢相关基因,发现新靶点和诊断模型,意义重大。
心血管疾病(Cardiovascular diseases,CVD)如今已成为全球健康的 “头号杀手”,无情地夺走无数人的生命,给社会带来沉重的负担。大量研究证实,脂质代谢与 CVD 之间存在着千丝万缕的联系。然而,目前脂质代谢相关的药物靶点十分有限,即便使用现有的降脂药物,依然存在着与脂质相关的心血管风险,这让医生们在治疗 CVD 时常常感到力不从心。
为了打破这一困境,探寻新的治疗靶点和诊断生物标志物,国外研究人员开展了一项系统性的基因组和表型组分析研究。该研究成果发表在《Research》上,为 CVD 的防治带来了新的曙光。
在这项研究中,研究人员运用了多种关键技术方法。他们首先从京都基因与基因组百科全书(KEGG)和 Reactome 数据库收集数据,构建脂质代谢相关基因集。之后,利用全基因组关联研究(Genome-wide association study,GWAS)的孟德尔随机化(Mendelian randomization,MR)因果推断方法,筛选与 CVD 发生发展有因果关系的基因,并在两个独立队列中通过共定位分析进行验证。同时,运用全表型组关联研究(Phenome-wide association studies,PheWAS)和药物靶点 - 药物关联分析进行反向筛选。最后,整合血清蛋白质组数据,使用 XGBoost 机器学习技术构建疾病预测模型。
研究结果如下:
- 识别与脂质代谢调控基因相关的有效 QTLs:研究人员从 KEGG 和 Reactome 数据库中整理出 881 个参与脂质代谢相关信号通路的基因,通过在 eQTLGen 和 deCODE 数据库中匹配,以严格的 P 值阈值 1.00×10??筛选,最终确定了 25,115 个与 609 个脂质代谢调控基因相关的有效数量性状基因座(Quantitative trait loci,QTLs)。这些 QTLs 可能影响基因表达水平,进而在脂质代谢调控中发挥作用。
- 通过 MR 和共定位分析确定与 CVD 相关的基因:基于上述 QTLs,研究人员在两个 GWAS 数据集(ebi-a-GCST90086053 和 finn-b-I9_CVD 队列)中进行 MR 分析,发现 61 个基因在 ebi-a-GCST90086053 队列、67 个基因在 finn-b-I9_CVD 队列与 CVD 相关,其中 54 个基因在两个队列中均被识别。这些基因主要分布在磷脂代谢、脂肪酸代谢等多个脂质代谢信号通路中。随后,在两个扩展的 GWAS 队列中对这 54 个基因进行共定位分析,结果显示 29 个基因与 CVD 的关联有强共定位支持(PH4 值 > 0.8),12 个有中等支持(0.8>PH4>0.5),进一步明确了脂质代谢相关基因与 CVD 的因果关系。
- 确定 CVD 治疗的脂质代谢靶点:研究人员开发了一套评分系统,综合多个标准评估靶点的 “新颖性” 和 “潜力”。按照该系统,最终确定了 29 个用于 CVD 治疗的脂质代谢靶点,其中 13 个此前已被报道为药物靶点并用于其他疾病治疗。
- 反向 PheWAS 验证基因治疗 CVD 的潜力:对 29 个优先基因进行反向 PheWAS 验证,发现这些基因或多或少与至少 3 - 5 种 CVD 并发症相关。FADS2、HSD17B12 等基因对 CVD 相关表型贡献显著,相关表型多与脂质代谢和 CVD 有关,表明这些基因在调节脂质代谢稳态和治疗 CVD 方面有潜在价值。
- 潜在的 CVD 靶向治疗:对 13 个已确定的药物靶点进行深入研究,多表型 MR 分析显示,FASD2、GSTM4 等多个基因与至少 5 种 CVD 相关并发症有关,是 CVD 复杂病因中的关键因素。通过挖掘 DrugBank 和 ChEMBL 数据库,构建了药物 - 靶点 - 三联体 - 疾病网络,为 CVD 的精准治疗提供了指导。
- 基于 5 种蛋白质的 CVD 预测机器学习模型:研究人员从血清蛋白质组数据中提取目标相对丰度,构建预测模型。分析发现 HPGD、PIP4K2C 等 5 种蛋白质在 CVD 患者和健康个体中表达差异显著,基于这 5 种蛋白质构建的机器学习模型对 CVD 的预测准确率高达 96.1%,对非 CVD 患者的预测准确率为 97%,为 CVD 的精准诊断提供了新工具。
研究结论和讨论部分指出,该研究全面揭示了脂质代谢调控靶点与 CVD 之间的复杂关系。研究人员成功识别出与 CVD 因果相关的基因、潜在治疗靶点及对应药物,并开发出预测准确率高的机器学习模型。这不仅为 CVD 的发病机制研究提供了新视角,也为其预防和治疗提供了潜在策略。不过,研究也存在一定局限性,如 MR 和共定位分析依赖公共 GWAS 数据,可能遗漏部分有效基因;机器学习模型样本量有限,5 个关键基因在 CVD 中的因果关系还需在传统动物模型中进一步验证。但总体而言,该研究成果为未来 CVD 的研究和临床应用奠定了坚实基础,有望推动个性化医疗和临床决策的发展,开启 CVD 防治的新篇章。