基于可解释机器学习模型改善幼年特发性关节炎颞下颌关节受累的早期检测
《Scientific Reports》:Improving early detection of temporomandibular joint involvement in juvenile idiopathic arthritis with a clinically interpretable machine learning model
【字体:
大
中
小
】
时间:2025年11月08日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对幼年特发性关节炎(JIA)患者颞下颌关节(TMJ)受累临床检测准确性不足的问题,开发了一种基于XGBoost的机器学习模型。该模型通过分析26项临床特征,在独立测试集上达到85.5%的准确率,显著优于常规临床检查。SHAP分析显示髁状突活动度、面部不对称性等为关键预测特征,为JIA相关TMJ疾病的早期诊断提供了可靠工具。
在儿童风湿性疾病领域,幼年特发性关节炎(Juvenile Idiopathic Arthritis, JIA)作为最常见的慢性风湿性疾病,一直困扰着全球的医疗工作者。更令人担忧的是,30-45%的JIA患者会出现颞下颌关节(Temporomandibular Joint, TMJ)受累,这种情况往往在初期没有明显症状,但会悄然进展,导致面部畸形、张口受限等一系列严重后果。对于正处于生长发育期的儿童来说,TMJ受累还可能引起颌面部发育异常,甚至影响气道通畅性。
目前临床上面临的最大挑战在于诊断困难。常规的口颌面检查作为主要筛查手段,其准确性有限,导致TMJ受累往往被漏诊或延迟诊断。这种诊断困境源于JIA相关的TMJ疾病与其他类型的颞下颌功能障碍(Temporomandibular Dysfunction, TMD)以及正常的颌面部发育变异之间存在显著重叠。尽管国际共识建议进行标准化临床检查,包括评估TMJ压痛、最大张口度、面部对称性等指标,但由于缺乏领域专业知识和解读临床发现的能力,TMJ受累的诊断仍然充满挑战。
针对这一临床难题,由奥胡斯大学领衔的国际研究团队在《Scientific Reports》上发表了一项创新性研究。研究人员开发了一种基于人工智能(AI)的预测模型,旨在提高JIA患者TMJ受累的早期检测能力。该研究基于一个独特的纵向数据库——奥胡斯大学JIA-TMJ数据库,包含了2000年至2023年间6,153次标准化口颌面检查数据,涉及1,054名JIA患者。
研究团队采用极端梯度提升(Extreme Gradient Boosting, XGBoost)算法,从95个标准化检查项目中精选出26个最具临床相关性的特征进行模型训练。这些特征涵盖了口颌面症状、TMJ功能、面部形态和药物治疗等多个维度。为了确保模型的临床实用性,特征选择充分考虑了常规初诊中的可获取性,并与国际共识建议保持一致。
在模型开发过程中,研究团队采用了患者分离拆分和组感知交叉验证等先进技术,以解决同一患者多次检查数据的非独立性问题。通过随机搜索和分层组k折交叉验证,优化了模型的超参数,最终以宏平均F1分数作为优化指标。
技术方法方面,研究主要依托三个关键技术:基于XGBoost的机器学习算法用于预测模型构建;Shapley加性解释(SHAP)技术提供模型可解释性分析;使用丹麦西部地区专科转诊中心的1,054名JIA患者的6,153次标准化临床检查作为训练集,55名新诊断患者作为独立测试集进行模型验证。
模型测试结果
在55名新诊断患者的独立测试集上,XGBoost模型表现出色。总体准确率达到85.5%,受试者工作特征曲线下面积(AUC)为0.8571,显示出良好的判别性能。模型对"无TMJ受累"类别的预测极为准确,F1分数达0.91,而对"TMJ受累"类别的识别也表现出较高的灵敏度(71.43%),尽管精确度相对较低(45.45%)。
值得注意的是,模型预测的概率分布呈现明显的双峰特征,大多数预测结果集中在0%或100%附近,表明模型对分类结果具有高度信心。这种特性在临床决策支持中尤为重要,可为医生提供明确的参考依据。
模型可解释性分析
通过SHAP分析,研究人员深入揭示了影响模型决策的关键临床特征。结果显示,髁状突活动度减少是最重要的预测因子,其次是面部不对称性、下颌前伸能力、张口度减小等。这一发现与临床实践经验高度吻合,证实了模型决策的合理性。
具体而言,髁状突活动度评分中,0分表示正常活动,1分表示轻度受限,2分表示明显受限。SHAP分析显示,随着评分增加,模型预测TMJ受累的可能性显著上升。同样,面部不对称性和平面不对称性的存在也强烈提示TMJ受累的可能性。这些发现不仅验证了模型的临床相关性,还为临床医生提供了明确的重点观察指标。
临床一致性评估
模型预测与专家评估的一致性达到85.4%,具有统计学显著性(p<0.001)。然而,一个有趣的现象是,模型预测的TMJ受累患病率(20.0%)高于临床专家的评估(12.7%)。这种差异主要源于模型产生了较多的假阳性结果,但也可能反映了临床诊断中存在的低估现象。
研究人员指出,这种差异可能具有重要的临床意义。既往研究表明,由于临床检查的局限性和对影像学检查的依赖,TMJ受累的真实患病率可能被低估。因此,模型的"过度诊断"可能实际上捕捉到了一些临床检查难以发现的早期病变。
研究意义与局限
该研究的创新之处在于首次将AI技术系统性地应用于JIA患者TMJ受累的临床诊断预测。模型不仅具有较高的准确率,更重要的是具有良好的可解释性,使临床医生能够理解模型的决策依据,增强了对AI工具的信任度。
然而,研究也存在一些局限性。模型的适用性可能受到医疗机构检查项目完整性的限制,在某些检查项目较少的机构中应用可能受限。测试集中TMJ受累患病率较低可能影响某些性能指标的稳定性。此外,虽然数据集较好地代表了丹麦人群,但模型在其他人群中的泛化能力仍需进一步验证。
未来展望
研究人员建议,未来研究应着重在更多样化的人群中进行外部验证,以评估模型的普遍适用性。同时,可以考虑将影像学数据、生物标志物等更多维度的信息纳入模型,进一步提升预测性能。对于模型与专家评估存在分歧的病例,进行长期随访可能有助于验证模型的预测准确性。
此外,基于局部SHAP分析的案例研究将有助于临床医生更深入地理解模型决策过程,促进AI与临床实践的深度融合。研究人员还指出,未来可以开发针对鉴别诊断的模型,将骨关节炎、特发性髁状突吸收等其他颌面部疾病纳入考量。
该研究开发的机器学习模型展现了AI技术在辅助JIA患者TMJ受累早期诊断方面的巨大潜力。通过系统分析标准化临床数据,模型能够识别关键的预测特征,包括患者主诉的口颌面疼痛和临床检查发现的髁状突活动度减少、面部不对称性等。模型与专家评估的高度一致性证明了其作为临床决策支持工具的可靠性。
这项研究为改善JIA患者的长期预后提供了新的技术手段,体现了多学科合作在解决复杂临床问题中的价值。随着进一步的研究和优化,这种基于AI的工具有望成为风湿病和口腔颌面科医生的有力助手,为实现JIA相关TMJ疾病的早期诊断和干预开辟新的途径。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号