基于人工智能和纵向数据的CVD预测模型开发与验证:GRU神经网络在十年心血管疾病风险预测中的性能评估

《BMC Medical Informatics and Decision Making》:Development and validation of an artificial intelligence-based model for cardiovascular disease prediction using longitudinal data

【字体: 时间:2025年11月23日 来源:BMC Medical Informatics and Decision Making 3.8

编辑推荐:

  本研究针对伊朗高发的心血管疾病(CVD)预测难题,开发了基于门控循环单元(GRU)和长短期记忆(LSTM)神经网络的深度学习模型。利用TLGS队列十年纵向数据,研究显示GRU模型在预测10年CVD风险方面表现优异(男性AUC=0.738,女性AUC=0.739),优于传统混合效应模型。该模型仅需21个临床变量即可实现与大型研究相当的预测效能,为资源有限地区的CVD早期预警提供了实用工具。

  
心血管疾病(CVD)作为全球首位死因,在伊朗呈现出尤为严峻的流行态势,其发病率、死亡率和伤残调整寿命年(DALY)均显著高于全球平均水平。随着人口老龄化进程加速、 sedentary lifestyle 盛行以及肥胖率持续攀升,CVD的疾病负担预计将进一步加重。尽管现代医学在CVD治疗方面取得了长足进步,但该疾病仍以无症状方式悄然进展,往往直到出现严重并发症时才被确诊,错失了最佳干预时机。研究表明,高达80%的早发CVD死亡可以通过早期干预得以避免,这凸显了开发高效风险预测工具的紧迫性。
当前临床指南推荐的风险预测模型多基于传统统计学方法,这些模型在处理纵向医疗数据和捕捉变量间复杂非线性关系方面存在局限。随着人工智能技术的迅猛发展,深度学习模型为利用时序性健康数据提升预测精度带来了新的希望。为此,来自Tarbiat Modares大学和Sharif University of Technology的研究团队在《BMC Medical Informatics and Decision Making》上发表了最新研究成果,探讨了如何利用递归神经网络(RNN)处理纵向数据,以提升CVD预测性能。
研究人员利用Tehran Lipid and Glucose Study (TLGS)队列的十年随访数据,纳入了4,872名基线无CVD的成年人(1,942名男性,2,930名女性)。通过分析参与者9年、6年、3年前及CVD发生时的21项临床指标(包括血脂、血糖、血压、肾功能等),团队构建了两种深度学习模型——长短期记忆(LSTM)和门控循环单元(GRU),并与传统混合效应模型进行性能比较。
关键技术方法包括:使用TLGS队列的纵向数据(Phase I-VI),采用多重插补法处理缺失值,构建基于LSTM和GRU的循环神经网络模型,按8:2比例划分训练集和测试集,通过置换重要性分析识别关键预测因子,并采用混合效应逻辑回归作为传统方法对照。
模型性能比较
研究发现,在10年随访期间,共有545名参与者(11.2%)发生了CVD事件。深度学习模型整体表现优于传统方法,其中GRU模型展现了最佳预测能力。在男性中,GRU的AUC达到0.738,显著高于混合效应模型的0.70;在女性中,GRU的AUC为0.739,与混合效应模型(0.74)相当。值得注意的是,尽管仅使用了21个临床变量,这些模型的性能与使用数百个变量的大规模研究相当,体现了其高效性。
特征重要性分析
通过置换重要性分析,研究人员发现了显著的性别差异和时间动态特征。在男性中,空腹血糖(FPG)、收缩压(SBP)和非高密度脂蛋白胆固醇(non-HDL)等代谢指标在临近CVD发生时预测价值最高;而在女性中,2小时餐后血糖(2hPG)、SBP和基线BMI最具预测价值。这表明不同性别的CVD发展机制可能存在差异,需要采取不同的预警策略。
风险因素时序变化
纵向分析揭示了CVD患者与非患者之间风险因素的动态差异。在最终发生CVD的参与者中,年龄、血压、血糖、血脂等指标随时间推移呈现明显恶化趋势。例如,CVD组的基线年龄显著高于非CVD组(男性:53.54±11.98岁 vs 47.79±12.48岁),且这种差异在整个观察期内持续存在。类似地,CVD组的肾功能指标(eGFR)下降速度更快,血糖和血压控制情况也更差。
临床与社会人口学因素
除了生物医学指标,研究还发现了一些社会人口学因素与CVD风险的关联。CVD组参与者受教育程度(≤12年)比例更高,就业率更低,婚姻状况也存在显著差异。这些因素可能与健康素养、医疗资源可及性以及生活方式有关,共同影响着CVD的发生风险。
本研究通过创新性地应用GRU等深度学习模型处理纵向医疗数据,成功开发了高性能的CVD预测工具。相比传统方法,该模型不仅能更准确地识别高危个体,还能通过时间动态分析揭示风险因素的变化规律,为个性化预防提供了新视角。研究结果表明,即使使用有限的临床变量,深度学习模型也能实现与大规模研究相当的预测效能,这对于医疗资源有限的中低收入国家具有重要实践价值。
然而,作者也指出本研究存在一定局限性,如仅使用单一队列数据,需要外部验证确认模型的泛化能力。未来研究可整合影像学、遗传学等多模态数据,并结合可解释人工智能技术,进一步提升模型的临床适用性和透明度。总体而言,这项工作为利用人工智能技术改善CVD早期预警系统提供了有力证据,有望在公共卫生和临床实践中发挥重要作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号