
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能模型预测糖尿病足风险的多中心研究:基于深度学习和机器学习的集成方法创新
【字体: 大 中 小 】 时间:2025年08月23日 来源:BioData Mining 6.1
编辑推荐:
本研究针对糖尿病足(DF)早期筛查难题,创新性地结合深度学习(DL)和机器学习(ML)技术,开发出多模型预测工具。研究人员通过上海11家社区医院6180例老年糖尿病患者数据,采用Lasso回归筛选出16个关键风险因子(如ABI、MMSE评分等),构建14种ML模型和3种DL模型组成的集成系统。最终Logistic回归集成模型表现最优(AUC达0.943),并开发可视化临床应用工具,为DF早期干预提供精准高效的AI决策支持。
糖尿病足(DF)作为糖尿病最严重的并发症之一,每年导致全球15-20%的糖尿病患者面临截肢风险。传统筛查方法如踝肱指数(ABI)检测和足部保护性感觉丧失(LOPS)评估,虽在临床广泛应用,却存在主观性强、效率低下等局限。更棘手的是,这些方法难以捕捉多种临床指标间的复杂相互作用,导致大量高风险患者被漏诊。随着人工智能技术的迅猛发展,如何将机器学习(ML)与深度学习(DL)的优势相结合,构建既准确又可解释的预测模型,成为当前DF早期预警领域的关键挑战。
《BioData Mining》最新发表的多中心研究给出了创新解决方案。该研究团队从上海11家社区医院纳入6180例60-85岁老年糖尿病患者,采用Lasso回归筛选出16个核心预测因子,包括血管指标(LABI/RABI)、认知功能(MMSE评分)等。通过构建14种ML模型和3种DL模型的集成系统,并开发配套临床应用工具,实现了DF风险的精准预测与可视化解读。
关键技术方法包括:1)采用SMOTE算法处理数据不平衡问题;2)通过网格搜索和5折交叉验证优化模型超参数;3)构建包含DNN、CNN和Transformer的深度学习架构;4)应用SHAP值进行模型可解释性分析;5)开发支持单例和批量预测的临床应用系统。
研究结果部分显示:
基线特征:高风险组患者表现出显著更低的MMSE评分和ABI值,同时伴有更高的碱性磷酸酶(ALP)水平和抑郁评分,这些差异为模型构建提供了重要生物学依据。
特征选择:Lasso回归确定的16个预测因子中,LABI(系数-0.038)和MMSE评分(系数-0.016)呈负相关,而ABI结果(系数0.031)和足背动脉搏动(系数0.027)等呈正相关,揭示了DF风险与血管、神经功能的复杂关联。
模型性能:在众多模型中,Logistic回归集成模型展现出最优异的预测性能,验证集AUC达0.943(95%CI:0.935-0.951),准确率0.877,同时保持良好校准性。相比之下,Transformer模型表现最弱(AUC仅0.663),凸显了在小样本医疗数据中传统ML的优势。
临床解释:SHAP分析揭示ABI结果、MMSE评分和下肢不适是最具预测力的特征。如图4所示,SHAP依赖图直观展示了这些特征与DF风险的剂量反应关系,为临床决策提供了透明依据。
应用开发:研究团队开发的预测应用创新性地实现了"多模型集成可视化",支持临床医生同时调用多个算法进行预测比较。如图5所示,该系统可处理单例输入或批量数据,输出风险概率分布图和分层结果,显著提升了筛查效率。
讨论部分指出,该研究通过集成多种算法优势,克服了单一模型的局限性。特别是将XGBoost的特征选择能力与CART的非线性关系捕捉能力相结合,使模型在保持高准确性的同时增强临床可解释性。尽管深度学习在特征提取方面具有理论优势,但在实际医疗场景中,集成学习因其稳定性和透明度更受临床青睐。
该研究的创新价值体现在三方面:首先,首次将Stacking集成策略应用于DF预测,通过Logistic回归元学习器整合基模型优势;其次,开发的临床应用工具支持多模型结果对比,降低单一模型偏差风险;最后,全面的SHAP解释既满足全局特征重要性分析,又能提供个体化预测解读。这些突破为糖尿病并发症的智能化管理提供了新范式,未来通过纳入实时监测数据和扩大样本多样性,有望进一步优化预测效能。
生物通微信公众号
知名企业招聘