LNWD 法:精准识别复杂疾病临界状态,开启个性化诊疗新篇

【字体: 时间:2025年03月21日 来源:Scientific Reports 3.8

编辑推荐:

  研究人员为识别复杂疾病临界状态,开展 LNWD 法研究,成功识别多种疾病临界状态,助力个性化诊断。

  在生命的健康之路上,复杂疾病就像隐藏在暗处的 “杀手”,时刻威胁着人们的生命安全。以癌症、糖尿病等为代表的复杂疾病,其发展过程并非是一条平稳的曲线,而是充满了 “急转弯”。在疾病从相对正常状态向疾病状态转变的过程中,有一个极为关键的时期 —— 疾病前期(pre - disease state),这一时期就像是健康与疾病之间的 “十字路口”,身体处于一种不稳定的状态,如同在悬崖边徘徊,稍有不慎就会滑向疾病的深渊,但如果能及时发现并干预,就有可能重回健康轨道。然而,想要精准识别这个 “十字路口”,却困难重重。
生物系统在疾病进展中的动态变化涉及大量分子,临床数据维度高且噪音干扰多,样本数量还十分有限,这使得找到疾病前期的临界状态成为了一个巨大的挑战。传统的动态网络生物标志物(Dynamic Network Biomarker,DNB)方法虽然有效,它把复杂疾病的发展看作是一个高维非线性动力系统,依据临界减速理论,通过识别一组关键生物分子(如基因、蛋白质等)来提供预警信号,但该方法需要在每个时间点用多个样本数据评估三个统计条件,在样本量小的临床数据集中应用受限。在这种情况下,河南科技大学数学与统计学院的研究人员挺身而出,开展了一项极具意义的研究,相关成果发表在《Scientific Reports》上。

研究人员提出了一种基于单样本的无模型方法 —— 局部网络 Wasserstein 距离(Local Network Wasserstein Distance,LNWD)法,用于识别复杂疾病的临界转变和疾病前期状态 。该方法的核心原理基于非线性动力系统理论,利用 Wasserstein 距离(WD,也叫推土机距离)来衡量分布差异。WD 通过计算将一个分布转变为另一个分布所需的最小成本来量化差异,具有对称、能衡量整体差异、对小概率事件不敏感、可有效测量重叠少的分布差异等优势,能避免 Kullback - Leibler 散度可能遇到的问题。

在研究过程中,研究人员使用了多种关键技术方法。数据方面,从癌症基因组图谱(TCGA)数据库下载了肾乳头状细胞癌(KIRP)、肾透明细胞癌(KIRC)、肺腺癌(LUAD)、食管癌(ESCA)这 4 种不相关的临床肿瘤数据集,从基因表达综合数据库(GEO)获取了小鼠急性肺损伤(GSE2565)和大鼠 II 型糖尿病(GSE13268)数据集 。对于这些数据,研究人员进行了筛选和处理,如根据临床信息对样本分期,将基因探针名转换为基因名等。同时,利用 R 包 edgeR、limma 和 DESeq2 进行差异分析,筛选出差异基因;从 STRING 数据库下载蛋白质 - 蛋白质相互作用(PPI)网络,构建分子相互作用网络,并用 Cytoscape 进行可视化。

研究结果主要包括以下几个方面:

  • 识别癌症的临界转变点:将 LNWD 法应用于 TCGA 数据库中的 4 种癌症数据集。对于 KIRC,数据集产生了 1,848 个差异表达基因,在 II 期 LNWD 评分显著变化,预示疾病即将发生。生存分析表明,临界状态(II 期)前后样本的生存率有显著差异,且临界前生存时间明显更长,分子网络在 II 期也发生显著变化。KIRP 数据集有 1,695 个差异表达基因,III 期 LNWD 评分突然增加,预示疾病状态即将到来,生存分析和分子网络变化均验证了这一临界状态。ESCA 数据集产生 283 个差异基因,III 期 LNWD 评分显著变化,生存分析显示临界状态(III 期)前后样本生存率差异显著,分子网络在 III 期也有显著变化。LUAD 数据集有 1,853 个差异基因,IIB 期 LNWD 评分显著突变,表明这是疾病进入的阈值,同样,生存分析和分子网络变化支持了这一结论。
  • 识别小鼠急性肺损伤的临界转变:对小鼠急性肺损伤数据集(GSE2565)的研究发现,该数据集产生 121 个差异基因,暴露后 4 - 8 小时 LNWD 评分急剧增加,8 小时达到峰值,表明 8 小时前是疾病前期,8 小时后进入疾病状态,动态变化网络图显示在 8 小时网络结构显著变化,与 LNWD 法识别的临界状态一致。
  • 识别大鼠 II 型糖尿病的临界转变:在大鼠 II 型糖尿病数据集(GSE13268)中,产生 283 个差异基因,研究发现 8 周前 LNWD 评分有显著变化,8 周达到峰值,是临界转变点。动态变化网络图显示 8 周时网络结构显著变化,与 LNWD 法识别结果相符。通过与 KL 散度和 JS 散度对比,发现 WD 的相对标准差更小,表明 LNWD 法识别临界状态更准确。

研究结论和讨论部分指出,LNWD 法能在单样本水平有效检测复杂疾病的临界点或临界状态,适用于大多数复杂疾病的高通量基因表达数据。该方法计算复杂度较低,易于实施,且 Wasserstein 距离相比其他度量有明显优势。这一方法成功识别了多种疾病的疾病前期状态,如肾透明细胞癌在肿瘤扩散前、肺腺癌在转移前的临界阶段等,为个性化疾病诊断和预防医学提供了新的有力工具,具有巨大的应用潜力,有望为未来的医疗健康领域带来新的突破和变革,让人类在与复杂疾病的斗争中掌握更多主动权。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号