基于超声的机器学习模型用于区分IgG4相关涎腺炎和原发性干燥综合征

《International Dental Journal》:An Ultrasound-Based Machine Learning Model for Differentiating IgG4-Related Sialadenitis and Primary Sj?gren's Syndrome

【字体: 时间:2025年11月07日 来源:International Dental Journal 3.7

编辑推荐:

  免疫球蛋白G4相关唾液腺炎与原发性干燥综合征的超声评分系统结合机器学习模型研究,通过LASSO回归筛选出性别、口干、眼干、腮腺肿大、超声评分等8个关键特征,构建九种机器学习模型,其中LightGBM模型在验证集AUC达0.955,准确性93.7%,敏感性96.5%,特异性86.4%,决策曲线分析显示临床价值最优,SHAP分析表明性别、腮腺超声评分等特征对预测影响显著。

  本研究旨在开发并验证一种基于超声(US)评分系统的可解释机器学习(ML)模型,用于区分免疫球蛋白G4相关涎腺炎(IgG4-RS)与原发性干燥综合征(pSS)。这一区分对于患者的治疗选择和预后评估至关重要。由于这两种疾病在临床表现上存在重叠,传统的诊断方法存在一定的局限性,因此需要一种更可靠、更准确的工具来辅助诊断。

### 研究背景与意义

免疫球蛋白G4相关疾病(IgG4-RD)是一种涉及多个系统的纤维炎症性疾病,其特征包括血清免疫球蛋白G4(IgG4)水平升高、多器官炎症以及显著的IgG4阳性浆细胞浸润和胰腺、涎腺、肾脏和肺部的网状纤维化。其中,IgG4-RS作为IgG4-RD的一种亚型,占据了40%的病例。该疾病通常表现为无痛性涎腺肿大、分泌功能减退以及严重影响患者生活质量的症状。相比之下,原发性干燥综合征(pSS)是一种慢性自身免疫性疾病,主要由淋巴细胞浸润外分泌腺(尤其是涎腺和泪腺)引起,导致口干、眼干等症状。治疗方面,糖皮质激素是IgG4-RD的一线治疗手段,对于IgG4-RS患者能够有效改善涎腺功能,而pSS患者则往往对治疗无反应,并且涎腺功能逐渐恶化。因此,准确区分IgG4-RS与pSS对于患者的治疗和预后至关重要。

当前的临床区分方法存在一定的局限性。IgG4-RS和pSS在一些临床特征上存在重叠,如涎腺肿大、口干、眼干以及高免疫球蛋白血症和低补体血症,这使得临床诊断变得困难。涎腺活检作为诊断的金标准,虽然能够提供准确的信息,但具有侵入性,存在出血和感染等风险。此外,由于样本量小或取样误差,有时无法得出明确结论。影像学方法,如计算机断层扫描(CT)和磁共振成像(MRI),虽然在某些情况下能够提供有价值的信息,但CT使用辐射,MRI成本较高,且对于细微变化的检测可能不够敏感。因此,开发一种更可靠、更准确的诊断工具显得尤为重要。

### 方法与技术

为了克服这些挑战,本研究引入了机器学习技术,并结合超声评分系统来提高诊断的准确性。研究纳入了263名患有IgG4-RS或pSS的患者,将其分为训练组(184人)和验证组(79人)。为了解决数据集不平衡的问题,研究采用了合成少数过采样技术(SMOTE)。此外,研究利用最小绝对收缩和选择算子(LASSO)回归来筛选出最优特征,并基于这些特征构建了多种预测模型,包括逻辑回归(LR)和八种机器学习算法。模型的性能通过多种指标进行评估,包括曲线下面积(AUC)、准确率、灵敏度、特异性等。同时,使用Shapley Additive explanations(SHAP)算法来量化特征对模型预测的贡献。

### 研究结果

通过LASSO回归筛选,研究确定了八个关键特征:性别、口干、眼干、腮腺肿大、下颌下腺肿大、腮腺超声(PGUS)评分、下颌下腺超声(SMGUS)评分以及下颌下腺血流评分(SMGV)。在这些模型中,轻梯度提升树(LightGBM)模型表现最佳,其在验证组中达到了0.955的AUC值,93.7%的准确率,96.5%的灵敏度,以及86.4%的特异性。此外,决策曲线分析(DCA)进一步确认了LightGBM模型在临床应用中的优越性。

SHAP分析结果显示,女性、低SMGUS评分、高PGUS评分、无下颌下腺肿大以及低SMGV评分是区分pSS的关键预测因子。这些特征能够帮助临床医生更好地理解模型的预测逻辑,并在实际诊断中提供有价值的参考。

### 模型的临床价值

本研究的模型基于国际上已被验证的涎腺超声评分系统,这一系统具有明确的评分参数和统一的评分规则,已被广泛应用于涎腺疾病的诊断。通过结合临床特征和超声评分参数,该模型不仅提高了诊断的准确性,还增强了模型的可解释性,使得非专业人员也能够理解和应用该模型。这种可解释性对于推广和普及该模型至关重要,因为它能够减少对专业设备和人员的依赖,从而使得诊断工具能够被广泛应用于初级医疗保健和非专业环境。

此外,研究还发现,LightGBM模型在处理高维数据和捕捉非线性特征关系方面表现出色,能够更好地适应临床和超声数据的复杂性。通过决策曲线分析和临床影响曲线(CIC)分析,研究进一步验证了该模型在临床中的实用价值,确认其在区分IgG4-RS和pSS方面具有较高的净收益。这些结果表明,LightGBM模型不仅在技术上具有优势,而且在实际应用中也具有重要的临床意义。

### 研究局限性与未来方向

尽管本研究取得了一定的成果,但仍存在一些局限性。首先,该研究为回顾性设计,且样本量相对较小,这可能引入一定的选择偏差。其次,所有患者均来自同一医疗机构,这可能限制了研究结果的普遍适用性。因此,未来的研究需要更大规模的多中心试验来验证模型的适用性。此外,尽管研究中采用了标准化的设备参数,但超声图像的获取涉及不同的设备,这可能影响图像特征的一致性,从而影响模型的性能。因此,进一步研究以确认临床适用性是必要的。

此外,本研究仅考虑了一部分临床特征和超声参数,忽略了诸如遗传标志物、其他免疫学指标以及多模态影像数据等可能影响诊断准确性的因素。这些因素的纳入可能有助于提高模型的诊断能力。同时,深度学习算法在头颈病变的诊断中也表现出良好的性能,因此未来的研究可以探索将多模态数据与深度学习算法相结合,以进一步提升诊断效果。

### 结论

综上所述,本研究开发了一种基于机器学习的模型,能够有效区分IgG4-RS与pSS。该模型结合了临床数据和超声评分参数,具有较高的诊断准确率和良好的临床适用性。然而,未来的研究需要克服当前的局限性,以进一步提升模型的可靠性与广泛适用性,从而实现更准确、更有效的诊断。这一研究不仅为临床诊断提供了新的工具,也为相关疾病的早期发现和干预提供了新的思路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号