基于深度学习健康空间模型的有序响应分析及其在个性化医疗中的应用研究

【字体: 时间:2025年05月17日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  为解决个性化医疗中高维健康数据可视化及非线性关系建模难题,研究人员开发深度学习健康空间(HS)模型,包含 4 种二元深度神经网络(DNN)和 1 种深度有序神经网络(DONN)。经多队列验证,DONN 模型在区分健康状态中表现最佳,为精准健康可视化提供新工具。

  
在精准医疗时代,海量高维健康数据如电子健康记录(EHRs)、多组学数据的涌现,为个性化健康管理带来机遇的同时,也面临如何直观展示个体健康状态的挑战。传统统计方法如主成分分析(PCA)虽能降维,但生成的轴往往缺乏生物学意义,难以揭示氧化应激、代谢应激等关键生理过程与健康的关联。而基于比例优势模型(POM)的健康空间(HS)模型虽能通过氧化、代谢等生物学轴可视化健康状态,却受限于线性假设,无法捕捉复杂非线性生物关系。在此背景下,首尔国立大学的研究人员开展了深度学习 HS 模型的研究,相关成果发表于《BMC Medical Informatics and Decision Making》,为突破传统模型瓶颈提供了新方向。

研究团队开发了 5 种深度学习 HS 模型,包括 4 种用于二元结局的标准深度神经网络(DNN)和 1 种保留因变量有序性的深度有序神经网络(DONN)。研究采用韩国国民健康与营养检查调查(KNHANES,32,140 样本)进行训练,并利用梨花博拉梅队列(862 样本)和韩国协会资源(KARE)项目(3,199 样本)进行外部验证。关键技术方法包括:将健康状态划分为 4 个有序组别(0 = 健康,1=1 个代谢风险因素,2=2 个代谢风险因素,3 = 代谢综合征或氧化应激相关疾病);基于氧化应激(年龄、白细胞计数等 5 个变量)和代谢应激(BMI、甘油三酯等 6 个变量)构建双轴 HS 模型;通过健康空间指数(HSI)、轮廓系数、Calinski-Harabasz 指数等评估模型性能,其中 HSI 通过置信椭圆和 Jaccard 指数衡量组间分离度。

深度学习 HS 模型性能优于传统统计模型


在 KNHANES 训练数据中,DONN 模型的平均 HSI 达 0.74,显著高于 POM 模型的 0.43 及其他 DNN 模型(0.45-0.58)。 Bootstrap 分析显示,DONN 的 95% 置信区间(0.710-0.765)与其他模型无重叠,稳定性突出。可视化结果表明,DONN 能更清晰地将健康组(0)与疾病组(3)分布于二维空间的左下和右上区域,中间风险组(1、2)呈梯度分布,体现了有序响应的优势。

外部验证证实 DONN 的泛化能力


在梨花博拉梅队列和 KARE 数据中,DONN 的 HSI 分别为 0.53 和 0.41,均排名第一。聚类指标方面,其轮廓系数在梨花博拉梅队列为 - 0.08(最高),Calinski-Harabasz 指数为 487.60(最高), Davies-Bouldin 指数为 2.41(最低),显示出最佳的组间分离度和聚类紧凑性。相比之下,传统 POM 模型在多数指标中排名第二,而二元 DNN 模型因忽略有序性导致性能波动。

深度学习为健康可视化注入新动力


研究表明,DONN 通过保留健康状态的有序信息并建模非线性关系,显著提升了 HS 模型的区分能力。尽管深度学习模型存在可解释性不足、依赖特定人群数据等局限,但其在捕捉复杂生物模式方面的优势,为动态监测健康轨迹、评估干预效果奠定了基础。例如,通过跟踪个体在 HS 空间中的位置变化,可预测疾病风险或优化个性化治疗方案。未来,结合可解释 AI(XAI)技术和更多生物学轴(如炎症)的扩展,有望进一步推动 HS 模型在临床决策中的应用,助力实现 “数据驱动” 的精准健康管理。

这项研究突破了传统统计模型的线性限制,证明深度学习在高维健康数据可视化中的潜力,为个性化医疗中个体健康状态的客观评估提供了更强大的工具。随着多组学数据的积累和模型优化,HS 模型有望成为连接大数据与临床实践的关键桥梁,推动精准医学向更直观、更智能的方向发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号