
-
生物通官微
陪你抓住生命科技
跳动的脉搏
脂质代谢重编程驱动肺纤维化:基于机器学习的KLF4靶向诊断模型与机制研究
【字体: 大 中 小 】 时间:2025年07月12日 来源:Orphanet Journal of Rare Diseases 3.4
编辑推荐:
本文针对特发性肺纤维化(IPF)缺乏有效生物标志物和治疗靶点的难题,通过整合多组学数据与机器学习算法,首次构建了基于脂质相关基因的诊断和预后模型。研究发现KLF4通过调控肺泡上皮细胞迁移促进纤维化进程,为IPF的精准诊疗提供了新靶点。该成果发表于《Orphanet Journal of Rare Diseases》,为理解脂质代谢在IPF中的作用机制及临床转化奠定基础。
特发性肺纤维化(IPF)是一种致命的间质性肺病,患者5年生存率仅38%,但发病机制尚未完全阐明。近年来,脂质代谢异常被发现在肺组织修复和纤维化中扮演关键角色:肺泡表面活性物质90%由脂质构成,而IPF患者中低密度脂蛋白(LDL)代谢紊乱可加速肺纤维化。然而,脂质相关基因如何驱动IPF进展,能否成为诊疗靶点仍未知。
为破解这一难题,四川省人民医院(Sichuan Provincial People's Hospital)的研究团队开展了一项跨组学研究。他们从GEO数据库获取IPF患者肺组织、肺泡灌洗液(BALF)和血液样本的多组学数据,通过四步核心技术展开攻关:
生物信息学挖掘:基于GeneCards筛选脂质相关基因,利用共识聚类将IPF患者分为两种亚型(Cluster A/B),发现其肺功能(FVC/DLCO)和纤维化基因(MUC5B/TGFB1等)表达显著差异;
模块化分析:采用加权基因共表达网络(WGCNA)锁定与IPF最相关的"蓝色模块",从中筛选出104个核心基因;
机器学习建模:通过104种算法组合构建诊断模型(Stepglm+GBM)和预后模型(StepCox+RSF),并在6个独立数据集中验证;
实验验证:结合单细胞测序(scRNA-seq)发现KLF4在肺泡Ⅱ型上皮细胞(AT II)异常表达,通过细胞敲除实验(siRNA)和功能检测(CCK-8/划痕实验)验证其促纤维化机制。
1. 脂质相关基因聚类揭示IPF亚型异质性
通过GSE47460数据集的145例IPF样本分析,基于脂质基因的共识聚类明确区分Cluster A/B两亚型:
Cluster B富集脂肪酸合成通路,且CD8+T细胞等免疫浸润显著升高(图1D)
Cluster B患者肺功能指标FVC(P<0.05)和DLCO(P<0.01)更差,促纤维化基因TGFB1/COL3A1表达更高(图1H-O)

2. WGCNA锁定核心模块与Hub基因
蓝色模块与IPF表型相关性最强(r=0.72, P=1e-12),且模块内基因显著性(GS)与模块成员(MM)高度正相关(图2E)
功能富集显示该模块调控细胞外基质(ECM)受体相互作用和血管平滑肌收缩通路(图2G-H)
PPI网络鉴定出CAV1、KLF4、AGTR1为关键Hub基因(附表5)

3. 机器学习模型实现精准诊疗预测
诊断模型:基于15个基因构建的Stepglm+GBM模型在训练集(GSE47460)和验证集(GSE32537等)AUC均>0.95(图3B-E),显著优于既往模型
预后模型:10基因StepCox+RSF模型在BALF数据集(GSE70866)预测生存的C-index达0.79,血液验证集(GSE28221/GSE93606)C-index为0.65-0.70(图4B-D)

4. KLF4驱动纤维化的单细胞与实验证据
scRNA-seq显示:KLF4在AT II细胞中特异性下调(图5G),且IPF患者脂质代谢评分显著降低(P<0.001)
功能实验证实:
KLF4敲除(siKLF4)使AT II细胞迁移能力提升2.1倍(图6B),但增殖无变化(图6A)
KLF4抑制降低E-cadherin表达(上皮标志物),升高Vimentin(间质标志物),促进上皮-间质转化(EMT)(图6C-E)
KLF4缺失同时增强巨噬细胞/成纤维细胞的增殖和迁移能力(图7)

本研究首次建立了IPF的脂质相关基因诊断预后模型,其卓越性能(AUC>0.95)为临床无创诊断提供新工具。更关键的是,通过多组学整合与实验
生物通微信公众号
知名企业招聘