基于常规实验室检验的多准则特征集成框架:提升干燥综合征诊断准确性的AI新策略
《npj Digital Medicine》:A multi-criterion feature integration framework for accurate diagnosis of Sj?gren’s disease using routine laboratory tests
【字体:
大
中
小
】
时间:2025年11月28日
来源:npj Digital Medicine 15.1
编辑推荐:
本研究针对干燥综合征(SjD)诊断延迟和缺乏敏感生物标志物的临床难题,开发了一种基于常规实验室检验的人工智能诊断模型SMFIF。研究人员通过多中心回顾性研究分析34,958例患者数据,筛选出16个关键特征构建集成学习模型,在测试集、内部验证集和外部验证集的AUC分别达到0.929、0.934和0.964,显著优于传统生物标志物(抗-SSA/Ro、ANA等)。该模型为基层医疗机构提供了低成本、易获取的诊断工具,有望改善SjD的早期识别和患者预后。
干燥综合征(Sj?gren's disease, SjD)作为常见的系统性自身免疫疾病,长期以来困扰着临床医生和患者。这种疾病不仅表现为典型的口干、眼干症状,更可能累及全身多个器官系统,从轻微的腺体功能障碍到严重的肺、肾、心血管并发症。更令人担忧的是,由于缺乏高度特异性的生物标志物,加上症状的非特异性,大量患者被误诊为类风湿关节炎、系统性红斑狼疮等其他风湿性疾病,诊断延迟成为常态。
当前SjD的诊断主要依赖临床专家评估,虽然存在ACR-EULAR分类标准,但这些标准主要用于研究而非个体诊断。抗-SSA/Ro抗体作为关键指标,其敏感性仅75%左右,意味着四分之一患者可能被漏诊。其他辅助检查如唇腺活检具有侵入性,唾液腺造影等检查成本较高,在基层医疗机构难以普及。这种诊断困境直接导致患者预后不佳,生活质量下降,恶性肿瘤风险增加。
在这一背景下,南京大学医学院附属南京鼓楼医院刘舒、吴观浩等研究人员开展了一项大规模多中心研究,旨在开发一种基于常规实验室检验的人工智能诊断模型——干燥综合征多准则特征集成框架(Sjogren Multi-criterion Feature Integration Framework, SMFIF)。该研究近期发表在《npj Digital Medicine》期刊,为SjD的早期诊断提供了新思路。
研究团队采用回顾性多中心设计,收集了2013年1月至2023年1月期间三家中国医院的34,958例患者数据。通过系统化的数据预处理、多算法特征选择和集成学习策略,构建了SMFIF模型。技术方法主要包括:使用随机森林填补缺失值,采用六种特征选择算法筛选关键变量,基于SHAP值进行特征重要性评估,通过 stacking集成学习整合七个机器学习分类器,并在内部和外部验证集进行性能评估。
研究人群涵盖南京鼓楼医院(NDT)队列17,558例(训练集)和7,526例(测试集),内部验证集9,329例,外部验证集545例(来自苏州医院和淮安第一医院)。SjD患者中位年龄52-56岁,女性占比89.9%-94.7%,症状持续时间显著长于对照组(2.8-4.0年 vs 0.6-0.8年)。合并症分析显示SjD组肝病(7.5%-9.0% vs 3.0%-5.0%)、肾病(14.4%-17.0% vs 4.9%-8.0%)、肺部疾病(7.9%-13.0% vs 3.0%-5.0%)发生率均高于对照组。
通过六种特征选择算法和SHAP分析,最终确定16个核心特征:肌酐(Crea)、γ-谷氨酰转移酶(GGT)、尿酸(UA)、总蛋白(TP)、磷(P)、腺苷脱氨酶(ADA)、葡萄糖(Glu)、直接胆红素(DBIL)、氯离子(Cl-)、球蛋白(GLO)、碱性磷酸酶(ALP)、估算肾小球滤过率(eGFR)、高密度脂蛋白胆固醇(HDL-C)和补体4(C4)。
SMFIF在测试集、内部验证集和外部验证集的AUC分别为0.929(95%CI:0.923-0.935)、0.934(95%CI:0.929-0.939)和0.964(95%CI:0.943-0.986),准确率分别为0.858、0.859和0.960。与传统生物标志物相比,SMFIF显著优于抗-SSA/Ro(AUC:0.705)、抗-SSB/La(AUC:0.575)、ANA(AUC:0.709)、RF(AUC:0.688)等指标。
校准曲线显示预测概率与实际结果高度一致,混淆矩阵证实模型在不同数据集中均保持高敏感性和特异性。特别值得关注的是,SMFIF能够有效区分SjD与类风湿关节炎(AUC=0.8336)、系统性红斑狼疮(AUC=0.8896)、系统性硬化症(AUC=0.8416)和骨关节炎(AUC=0.9149),展现出良好的鉴别诊断能力。
本研究开发的SMFIF模型首次基于大规模临床常规检验数据构建SjD人工智能诊断工具,通过多准则特征集成框架实现了优异的诊断性能。该模型的创新性在于将传统免疫指标与肝肾功能、代谢参数等常规检验项目有机结合,既保持了诊断准确性,又大幅降低了检测成本。研究团队已将模型代码公开,便于临床推广和应用。
尽管研究存在回顾性设计、单一人种数据等局限性,但SMFIF为SjD的早期诊断提供了实用解决方案。特别是在基层医疗机构,该模型可帮助医生识别疑似SjD患者,减少诊断延迟。未来需要通过前瞻性研究和多国别验证,进一步确认模型的普适性,并探索整合临床症状、影像学特征等多模态数据的可能性,不断提升诊断精度。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号