编辑推荐:
糖尿病(Diabetes)引发的肾病严重威胁患者健康,现有预测工具匮乏且多依赖单次基线数据。研究人员开发 4 种模型预测 2 型糖尿病(T2D)患者肾功能恶化,发现引入临床病史数据可显著提升模型性能,对优化诊疗意义重大。
在当今社会,糖尿病(Diabetes)就像一颗 “健康炸弹”,在全球范围内肆意 “引爆”。国际糖尿病联盟的数据令人触目惊心,2021 年全球约有 5.37 亿人深受糖尿病困扰,预计到 2045 年,这个数字将飙升至 7.83 亿。其中,2 型糖尿病(T2D)最为常见,约占所有糖尿病病例的 90%。它就像一个隐藏在身体里的 “定时炸弹”,随着时间推移,会悄无声息地引发各种并发症,尤其是糖尿病肾病,已然成为导致终末期慢性肾脏病(CKD)的首要 “元凶”。据统计,糖尿病患者中 CKD 的患病率比普通人群高出近一倍,约 40% 的糖尿病患者会被糖尿病肾病 “盯上”,更可怕的是,其中 10% 的患者会因肾衰竭失去生命。
面对如此严峻的形势,尽早识别糖尿病患者发生肾脏并发症或病情加重的高风险个体,就成为改善患者预后、合理分配医疗资源的关键 “钥匙”。然而,现实却困难重重。肾脏疾病的异质性和疾病进展速度的差异,使得临床决策犹如在迷雾中摸索。目前,还没有被广泛认可的预测 CKD 进展的工具,医生们在决定治疗方案时,常常陷入两难境地,要么治疗延迟,要么过度治疗。
在这样的背景下,意大利的研究人员挺身而出,开展了一项意义非凡的研究。他们从 DARWIN - Renal(DApagliflozin Real–World evIdeNce–Renal)研究收集的数据出发,这是一项全国性多中心回顾性真实世界研究。研究人员开发了四种不同类型的机器学习模型,分别是逻辑回归、随机森林、Cox 比例风险回归,以及基于循环神经网络(RNNs)的深度学习模型,旨在预测 2 型糖尿病患者跨越 5 个临床相关的肾小球滤过率(eGFR)阈值的情况。研究发现,即便不引入过往就诊信息,所有模型的预测性能对所有结果来说都较为令人满意,受试者工作特征曲线下面积(AUROC)和 C 指数在 0.69 - 0.98 之间,平均精度也远超随机模型。但当引入过往信息后,所有模型的性能都得到了显著提升,AUROC 和 C 指数最高可增加 12%,平均精度更是提升了 300%。这项研究成果发表在《Computer Methods and Programs in Biomedicine》上,为糖尿病肾病的预测和防治开辟了新的道路,有望帮助医生更精准地制定治疗方案,改善患者的健康状况。
研究人员开展此项研究时,用到了几个关键技术方法。数据来源于 DARWIN - Renal 研究收集的 23281 名患者的常规体检数据。模型构建方面,运用了逻辑回归、随机森林、Cox 比例风险回归这几种经典的机器学习算法,以及基于循环神经网络(RNNs)的深度学习模型。同时,还通过特征重要性分析来确定预测中的关键变量。
研究结果
- 模型预测性能:研究人员通过对比未引入过往病史信息的基础模型和引入 6 个过往就诊相关变量的模型,分析了 90、45 和 15 mL/min/1.73 m2 eGFR 阈值在第 1 - 4 个预测期(即 6、12、18 和 24 个月)的情况。结果显示,所有模型对所有结局的预测性能都令人满意。未引入过往病史信息时,AUROC 和 C - 指数处于 0.69 - 0.98 之间,平均精度也高于随机模型;引入过往信息后,所有模型性能显著提升,AUROC 和 C - 指数最高提升 12%,平均精度提升 300% 。
- 特征重要性分析:通过特征重要性分析进一步证实了过往信息的重要性,明确了在预测过程中关键变量的地位,尤其是新纳入模型的纵向信息的重要程度得以评估。
研究结论和讨论
早期预测糖尿病患者 CKD 的发病或病情加重,对于改善患者预后、优化医疗资源分配具有极其重要的意义。以往文献中的大多数模型仅依赖基线就诊数据,忽略了过往就诊收集的信息。而本次研究首次系统评估了患者临床病史对不同预测模型性能的影响,发现将患者临床病史数据纳入预测模型,能显著提升模型性能,特别是对于循环神经网络这种深度学习模型,相比仅使用过往病史的综合指标,提供动态变量的完整序列值更能发挥优势。这一研究成果为后续糖尿病肾病的预测和防治研究提供了新的思路和方法,有望推动临床实践中对糖尿病肾病的早期干预和精准治疗,在改善糖尿病患者肾脏健康方面具有广阔的应用前景。