基于自然语言处理与机器学习解析患者自述症状文本在骨关节炎、纤维肌痛和免疫介导性风湿病诊断中的价值

【字体: 时间:2025年09月12日 来源:Rheumatology Advances in Practice 2.1

编辑推荐:

  本研究针对风湿病早期诊断难题,创新性地利用自然语言处理(NLP)和机器学习(ML)技术分析患者自由文本症状描述。通过支持向量机(SVM)模型对8,454例患者文本进行特征提取与分类,结果显示:骨关节炎(OA)和纤维肌痛(FM)模型特异性分别达0.82和0.92,显著减少误诊;免疫介导性风湿病(imRD)模型灵敏度达0.92,有效降低漏诊风险。决策曲线分析证实其临床实用性,SHAP值解析揭示症状描述与临床推理的一致性,为AI辅助风湿病诊断提供新范式。

  

在基层医疗实践中,肌肉骨骼症状约占全科门诊量的30%,但风湿性疾病的早期诊断始终面临重大挑战。免疫介导性风湿病(immune-mediated rheumatic diseases, imRD)需要及时干预以防止关节损伤和慢性疼痛,而骨关节炎(osteoarthritis, OA)和纤维肌痛(fibromyalgia, FM)则多采用保守治疗。由于患者描述症状的方式与临床术语存在差异,且传统依赖结构化输入(如复选框)的诊断支持系统难以捕捉症状的细微差别,导致鉴别诊断困难。尽管病史采集对诊断准确性的贡献高达80%,但如何有效利用患者自由文本描述辅助诊断,仍是未被充分探索的领域。

为此,研究人员开展了一项基于自然语言处理(natural language processing, NLP)和机器学习(machine learning, ML)的研究,旨在评估患者自述症状文本对OA、FM和imRD的诊断支持价值。该研究论文发表在《Rheumatology Advances in Practice》上。

研究采用来自9,013名患者的自由文本症状描述,经过数据清洗后保留8,454例样本。通过TF-IDF(term frequency-inverse document frequency)向量化方法提取文本特征,构建支持向量机(support vector machine, SVM)分类模型。模型针对OA和FM优化特异性,对imRD优化灵敏度,并在独立验证集上评估性能。采用SHAP(SHapley Additive exPlanations)值解析模型可解释性,并通过决策曲线分析(decision curve analysis, DCA)评估临床实用性。

模型性能验证

SVM模型在验证集上表现出中等诊断潜力:OA的AUC-ROC为0.68,FM为0.75,imRD为0.69。优化后,OA和FM模型特异性分别达0.82和0.92,误诊率仅17%和8%;imRD模型灵敏度为0.92,阴性预测值(NPV)为0.77,显著降低漏诊风险。

病例识别与阈值优化

通过群体分布图(swarm plots)设定概率阈值:OA和FM以0.75为高特异性阈值,imRD以0.15为高灵敏度阈值。在验证集中,OA模型在0.75阈值下识别561例真阳性(42%),假阳性率17%;FM模型识别167例真阳性(33%),假阳性率8%;imRD模型在0.15阈值下实现高灵敏度(0.92)和NPV(0.77)。

决策曲线分析

DCA显示,模型在多数阈值范围内净收益优于“全部转诊”或“不转诊”策略。OA模型在阈值>10%、FM在15-70%、imRD在15-30%范围内具有临床实用性。

模型可解释性

SHAP分析揭示关键症状词与临床推理一致:OA预测主要依赖“关节病(arthrosis)”“膝部(knee)”“疼痛(pain)”;FM依赖“晨僵(morning)”“僵硬(stiff)”“背痛(back pain)”;imRD依赖“僵硬(stiff)”“关节痛(joint pain)”“肌肉(muscle)”。这些词汇的高SHAP值表明其正向贡献于预测结果。

本研究证实,患者自由文本症状描述蕴含丰富的诊断信息,结合NLP和ML技术可有效支持风湿病分类诊断。模型在特异性(OA、FM)和灵敏度(imRD)方面的优化策略契合临床需求:减少OA/FM的过度转诊,避免imRD的漏诊。SHAP值解析增强了模型透明度和可信度,为AI辅助诊断工具的开发提供重要依据。尽管模型尚未达到独立诊断水平,但作为临床决策支持工具,尤其在基层医疗分流场景中,具有显著应用潜力。未来需进一步扩大样本多样性并探索多模态数据整合,以提升模型普适性和准确性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号