编辑推荐:
为解决 2 型糖尿病(T2DM)患者心血管并发症早期诊断难题,研究人员构建人工神经网络模型预测左心室舒张功能障碍(LVDD)风险。发现该模型性能优于传统机器学习方法,并开发 “LVDD-risk” web 服务器。为 T2DM 心血管并发症早筛提供新工具。
糖尿病作为全球高发代谢性疾病,其心血管并发症一直是患者死亡的主要原因。左心室舒张功能障碍(left ventricular diastolic dysfunction, LVDD)作为糖尿病心脏病变最早出现的心肌特征之一,若能在严重并发症发生前实现精准预测,将为早期干预赢得关键时间窗口。然而,传统诊断手段依赖有创检查或晚期影像学表现,难以满足大规模筛查需求。如何利用临床数据构建高效预测模型,成为糖尿病领域亟待突破的科学问题。
为此,西安医学院基础与转化医学研究所联合陕西省人民医院内分泌科的研究团队,针对 805 例中国 T2DM 患者(其中 597 例 LVDD 患者、208 例对照)展开深入研究。该团队开发了基于人工神经网络(artificial neural network, ANN)的 LVDD 风险预测模型,并通过可解释性方法挖掘关键影响因素,相关成果发表在《Diabetology & Metabolic Syndrome》。
研究技术方法
研究采用临床流行病学方法,收集患者 demographics(年龄、性别、BMI 等)、实验室指标(血脂、炎症因子、尿蛋白等)及并发症信息。通过 5 折交叉验证,对比 ANN 与 logistic regression(LR)、random forest(RF)、support vector machine(SVM)等传统机器学习算法的性能。利用 LIME(Local Interpretable Model-Agnostic Explanations)和类特异性特征显著性图,解析模型决策机制。最终基于最优模型开发 “LVDD-risk” web 服务器,实现临床数据输入与风险概率输出的可视化交互。
研究结果
1. 模型性能对比
ANN 模型在 5 折交叉验证和验证集中均表现最优,ROC-AUC 为 0.741±0.055/0.779,PR-AUC 为 0.881±0.036/0.916,显著优于 LR、RF 和 SVM(P<0.05)。这表明 ANN 通过多层非线性映射提取高阶特征的能力,更适用于复杂临床数据的模式识别。
2. 关键风险与保护因素
通过 1000 例虚拟患者的特征贡献分析,发现高 HDL、VitD、收缩压(SBP)、腰臀比(WHR)及低舒张压(DBP)是 LVDD 的主要风险因素,而高 LDL、DBP 则具有保护作用。值得注意的是,高密度脂蛋白(HDL)通常被视为心血管保护因子,但本研究发现其在 T2DM 人群中与 LVDD 风险正相关,提示 HDL 功能异常可能参与糖尿病心肌损伤机制,需进一步验证。
3. 可解释性与临床工具开发
类特异性显著性图显示,模型对 LVDD 高风险患者的预测更依赖代谢紊乱相关指标(如 WHR、TG),而低风险患者则以抗炎状态(如高 LDL)和血管功能正常(如 DBP)为特征。基于 7 项核心指标(性别、吸烟、WHR、SBP、DBP、HDL、VitD)开发的 web 服务器,支持缺失值填充和风险可视化,为临床快速筛查提供了便捷工具。
研究结论与意义
本研究首次基于中国 T2DM 人群构建 ANN 驱动的 LVDD 预测模型,证实其在早期心肌损伤识别中的效能优于传统算法。通过可解释性分析揭示的 HDL 悖论,为糖尿病心血管病变机制研究提供了新视角。“LVDD-risk” 服务器的开源部署(
http://www.bigc.online/ExsgRNA),使基层医疗机构无需复杂设备即可实现 LVDD 风险分层,有望推动糖尿病并发症防控关口前移。尽管研究存在样本量局限和缺乏纵向随访数据等不足,但其建立的 “数据驱动 - 模型构建 - 临床转化” 研究范式,为糖尿病精准医疗提供了可借鉴的方法论。未来需扩大队列验证关键生物标志物,并探索模型在治疗监测中的应用潜力。