《Diabetes Research and Clinical Practice》:Limitation of existing GFR estimating equations and application of artificial intelligence in improving GFR estimation and chronic kidney disease progression in people with diabetes
编辑推荐:
本综述系统评价了人工智能技术在糖尿病肾病患者肾小球滤过率(GFR)估算及慢性肾脏病(CKD)进展预测中的应用。文章指出,尽管CKD-EPI 2009方程是临床最常用的GFR估算工具,但其在糖尿病患者中的准确性受到质疑。综述重点探讨了机器学习(如人工神经网络、随机森林)和基于图像的深度学习等AI方法在提高GFR估算精度、预测CKD进展方面的潜力与挑战,并强调了未来需在大样本、多族裔人群中进行验证的重要性。
引言
肾脏是过滤血液中废物、毒素和液体的重要器官。肾小球滤过率(Glomerular Filtration Rate, GFR)被认为是评估肾功能的最佳整体指标。直接测量GFR(mGFR)需要使用外源性滤过标志物(如菊粉、碘海醇)的血浆或尿液清除率,但该方法耗时、侵入性强且昂贵,难以在临床常规或大规模研究中开展。因此,临床实践中主要依赖基于内源性滤过标志物(如血清肌酐、胱抑素C)的估算方程。
现有GFR估算方程的局限性
历史上,从Popper和Mandel于1937年提出使用内源性肌酐评估肾功能以来,已出现70多个基于肌酐的方程。1999年提出的肾脏病饮食改良(Modification of Diet in Renal Disease, MDRD)方程和2009年发布的慢性肾脏病流行病学合作研究(Chronic Kidney Disease Epidemiology Collaboration, CKD-EPI)方程是临床最常用的工具。MDRD方程基于一个平均mGFR约为40 mL/min/1.73 m2的慢性肾脏病(CKD)人群开发,排除了70岁以上及使用胰岛素的糖尿病患者,导致其在较高GFR值存在系统性低估,且对早期GFR下降不敏感。CKD-EPI 2009方程通过纳入更广泛的人群(包括不同族裔和糖尿病患者),在GFR >60 mL/min/1.73 m2时准确性显著优于MDRD方程。然而,近期系统评价表明,CKD-EPI 2009方程在糖尿病患者,尤其是早期糖尿病肾病患者中的诊断性能并不理想。
方程中纳入“种族”这一社会建构变量可能加剧医学中的系统性种族主义。为此,CKD-EPI协作组于2021年推出了不包含种族变量的新方程,但该方程在非裔美国人中低估mGFR,在非非裔美国人中高估mGFR。此外,基于肌酐和胱抑素C的方程虽更准确,但胱抑素C检测成本高、可用性差,限制了其临床应用。
糖尿病患者常出现肾小球高滤过(10–67%的1型糖尿病和6–73%的2型糖尿病患者),这会使基于肌酐的GFR估算变得不可靠。肌酐由骨骼肌产生,而许多2型糖尿病患者伴有肥胖,影响肌酐水平。此外,某些药物(如非诺贝特)可逆性增加血清肌酐,进一步干扰估算。因此,开发针对糖尿病的更准确GFR估算方法或寻找替代工具至关重要。
人工智能/机器学习在GFR估算中的应用
人工智能(AI),特别是机器学习(ML)和深度学习,能够处理高维数据,无需预设统计分布假设即可灵活建模复杂非线性关系,这使其在GFR估算和CKD进展预测中展现出优势。常用算法包括:
- •
人工神经网络(Artificial Neural Networks, ANN):模拟人脑学习过程,通过调整权重捕捉变量间复杂关联,是GFR估算研究中最常用的ML算法。
- •
决策树与随机森林(Random Forests):通过构建多个决策树进行集成学习,提升分类或回归任务的性能。
- •
支持向量机(Support Vector Machine, SVM):通过寻找最优超平面实现变量分类。
- •
深度学习(Deep Learning):使用深度神经网络处理非结构化或半结构化数据(如图像)。
人工智能在预测糖尿病肾病进展中的研究
多项研究利用AI预测糖尿病患者CKD进展。Chan等开发了名为KidneyIntelX的随机森林模型,整合了血浆生物标志物(TNFR1、TNFR2、KIM1)、eGFR、尿白蛋白/肌酐比(uACR)和收缩压,用于预测2型糖尿病患者5年内肾功能快速下降(eGFR下降>5 mL/min/年或≥40%持续下降)或肾衰竭的风险。该模型在1146例患者中显示出0.77的曲线下面积(AUC),优于临床模型的0.61。后续研究在CANVAS和CREDENCE试验队列中验证了其有效性,KidneyIntelX.dkd已获美国FDA批准用于临床。Ilyas等应用J48决策树算法预测CKD分期,准确率达85.5%。日本一项针对5657例CKD患者(25%合并糖尿病)的研究发现,随机森林模型在预测2年内eGFR极度快速下降(≥30%)方面优于逻辑回归模型(AUCs为0.69–0.79 vs. 0.68–0.75)。
人工智能在估算糖尿病患者肾功能中的研究
在GFR估算方面,Song等开发的知识型神经网络(KBNN)模型比传统回归方程和标准ANN模型误差更小。Liu团队进行了一系列研究,比较了ANN、SVM、集成学习等AI方法与CKD-EPI等传统方程的性能。他们发现,包含年龄、性别、血清肌酐、BMI、血尿素氮(BUN)等多变量的ANN或集成学习模型,在基于99mTc-DTPA测量的mGFR作为金标准时,往往表现出更低的偏差和更高的精度(P30%准确度可达75–88%)。例如,Chen等开发的四变量ANN模型(年龄、性别、肌酐、BMI)在2型糖尿病患者中的P30%为88.6%,优于CKD-EPI方程的80%。Li等开发的九变量ANN模型(包含肌酐、胱抑素C、年龄、性别、BMI、BUN、白蛋白、尿酸、血红蛋白)将P30%提高至80%。然而,Zhao等的外部验证研究发现,Liu等开发的集成学习模型在中国CKD患者中高估GFR,其性能不及亚洲改良的CKD-EPI方程。Wang等开发的深度神经网络模型使用125I-碘酞酸盐清除率作为参考,其P30%准确度达到88.3%,略高于CKD-EPI方程。Peng等提出的两阶段预测方法(特征筛选结合深度学习)也显示出优越性能。
基于图像的深度学习预测CKD或估算GFR
深度学习在医学图像分析中的应用为糖尿病肾病管理提供了新途径。Betzler等利用新加坡糖尿病视网膜病变筛查项目的26,568张眼底图像,开发深度学习模型检测糖尿病肾病(定义为持续eGFR <60 mL/min/1.73 m2),在内部验证中AUC达0.83。Shi等和中国的研究也报告了类似的高性能(AUC 0.91)。Zhang等的研究进一步表明,基于眼底图像的深度学习模型不仅能识别CKD(AUC 0.85–0.93),还能预测eGFR,平均绝对误差为11.1–13.4 mL/min/1.73 m2。此外,AI技术已用于通过CT图像自动量化肌肉面积以校正肌酐生成,或通过肾脏CT/MRI自动分割量化肾脏体积,从而可能改善GFR估算。
测量GFR的局限性及其对AI模型的影响
需要指出的是,常用的mGFR(以mL/min/1.73 m2表示)并非完美的金标准。其使用的体表面积(BSA)标准化方法(基于1916年的Du Bois公式)已过时,尤其在肥胖个体和身体成分改变的糖尿病患者中可能引入系统误差。用实际体重计算的BSA会因脂肪质量高而夸大BSA,导致GFR被低估。因此,若AI模型训练数据基于传统BSA标准化的mGFR,则可能延续而非纠正这些偏差。未来AI模型应考虑使用基于理想体重的BSA或细胞外液体积进行标准化。
结论与未来方向
AI技术在改善糖尿病患者GFR估算和CKD进展预测方面潜力巨大。然而,现有研究多基于中国人群的小样本数据,其泛化性有待在多族裔、大样本队列中验证。AI模型还存在“黑箱”问题(难以解释)和过拟合风险。未来需通过多中心合作获取高质量、多样化的数据,并将AI工具无缝集成到电子健康记录(EHR)系统中,同时解决数据质量、计算基础设施、临床医生培训以及相关伦理法规等实际挑战。作者团队正在利用来自五大洲合作队列的糖尿病患者的直接肾功能测量数据,开发一个名为RenoTrue?的ANN模型及临床决策支持工具,以期推动该领域的进步。