利用机器学习辅助的舌图像分析技术来诊断桥本氏甲状腺炎

《Frontiers in Medicine》:Machine learning-assisted tongue image analysis for the diagnosis of Hashimoto’s thyroiditis

【字体: 时间:2025年10月30日 来源:Frontiers in Medicine 3.0

编辑推荐:

  桥本甲状腺炎(HT)的舌象特征通过机器学习模型可有效区分甲状腺功能正常与减退状态。研究采用120例HT患者(60例功能正常,60例减退)的舌象图像,提取1125维特征,经mRMR筛选后构建随机森林(RF)、逻辑回归(LR)、支持向量机(SVM)和决策树(DT)模型。SVM表现最优,测试集AUC达0.894,灵敏度0.804,特异度0.936,95%置信区间下限0.819,模型稳定性强。外部验证集(40例)显示SVM仍保持最佳性能(AUC 0.879),验证模型泛化能力。研究表明舌象特征结合机器学习可有效辅助HT诊断,为临床提供非侵入性、低成本的智能筛查工具。

  本研究聚焦于通过舌象特征建立机器学习模型,以辅助诊断桥本甲状腺炎(Hashimoto’s thyroiditis, HT)及其伴随的甲状腺功能减退症。HT作为最常见的自身免疫性甲状腺疾病,其发病机制复杂且临床表现多样,往往导致误诊或漏诊,进而影响患者的治疗效果和生活质量。目前,HT的诊断主要依赖于抗体检测(如甲状腺球蛋白抗体TgAb和甲状腺过氧化物酶抗体TPOAb),但仍有约20%的患者因抗体阴性而难以确诊。此外,细针穿刺活检虽然具有一定的诊断价值,但因其侵入性、操作依赖性以及患者接受度低等问题,限制了其在临床筛查中的广泛应用。因此,寻找一种非侵入性、可重复性高、成本低廉且具有临床实用性的辅助诊断工具成为亟需解决的问题。

舌诊作为中医的重要诊断手段,具有观察舌色、舌形、舌苔和舌质等特征的能力,其与人体内脏功能密切相关,被认为是反映整体生理和病理状态的“窗口”。近年来,随着医学影像技术和人工智能的快速发展,舌象特征被逐步数字化,并应用于多种疾病的诊断和监测。例如,舌象分析已被用于评估甲状腺结节的恶性风险,以及筛查糖尿病、非酒精性脂肪肝病和新冠病毒感染等疾病。这些进展表明,舌象信息在疾病诊断中具有重要的临床价值,尤其在需要快速、非侵入性筛查的场景中。因此,探索舌象在HT及其相关甲状腺功能减退症中的诊断潜力,具有重要的临床意义和研究价值。

本研究通过收集120例HT患者的舌象图像和临床数据,构建了一个基于舌象特征的机器学习分类模型,旨在区分正常甲状腺功能(euthyroid)与甲状腺功能减退(hypothyroidism)的患者。所使用的数据包括来自辽宁省人民医院的120例HT患者(每组各60例)作为训练集,以及来自安徽省六安市舒城县人民医院的40例患者作为外部验证集。在数据预处理阶段,研究人员首先对舌象图像进行了感兴趣区域(ROI)分割,确保图像的标准化,并通过最大绝对值归一化对舌象特征进行处理。随后,使用最小冗余最大相关性(mRMR)方法对高维特征进行筛选,以保留与HT状态相关性最强的特征,同时减少特征间的冗余,提高模型的泛化能力和预测稳定性。

在模型构建过程中,研究人员采用了四种常见的机器学习算法:随机森林(Random Forest, RF)、逻辑回归(Logistic Regression, LR)、支持向量机(Support Vector Machine, SVM)和决策树(Decision Tree, DT)。这些模型因其在实际应用中的广泛性和代表性而被选中。其中,RF通过集成多个决策树实现非线性分类,具有较强的抗过拟合能力;LR通过逻辑函数建立变量间的概率关系,适用于二分类问题;SVM则通过寻找最优超平面实现分类,尤其适用于小样本和高维特征的数据集;DT通过递归分割策略构建分类结构,具有较好的可解释性。模型的评估指标包括AUC(曲线下面积)、灵敏度(Sensitivity)、特异性(Specificity)、阳性预测值(Positive Predictive Value, PPV)和阴性预测值(Negative Predictive Value, NPV),以全面衡量模型的分类能力和预测可靠性。

研究结果表明,所有模型在区分HT患者的正常甲状腺功能与甲状腺功能减退状态方面均表现出较高的分类能力,其AUC均高于0.82,且95%置信区间的下限均高于0.75,显示出模型的稳定性。其中,SVM在AUC方面表现最佳,达到0.894,显著高于其他模型(RF为0.857,LR为0.876,DT为0.828),表明其在分类能力上具有最强的稳定性。此外,SVM在灵敏度和特异性方面也表现出较好的平衡,灵敏度为0.804,特异性为0.936,能够有效识别真实阳性病例并减少假阳性情况。相比之下,DT虽然在灵敏度方面表现最佳(0.826),但其特异性较低(0.83),导致预测结果在某些情况下不够可靠。而LR和RF在特异性方面表现出色,其中RF的特异性甚至达到1.0,但其灵敏度相对较低,这可能与其对某些关键特征的忽视有关。

在外部验证阶段,SVM仍然展现出优异的分类性能,其AUC达到0.879,灵敏度为0.933,NPV为0.917,显示出较强的泛化能力。相比之下,其他模型在外部验证中的表现略有下降,但整体趋势仍与训练集一致,表明舌象特征在不同人群中具有一定的普适性。此外,研究还通过t-SNE(t分布随机邻域嵌入)算法对高维舌象特征进行可视化分析,结果显示,正常与甲状腺功能减退患者的舌象特征在二维投影中呈现出明显的聚类趋势,进一步验证了舌象特征在HT诊断中的重要性。

为了评估模型的预测可靠性,研究人员还绘制了校准曲线(Calibration Curves),以分析模型预测概率与实际疾病发生率之间的匹配程度。结果显示,逻辑回归模型的校准性能最佳,其预测概率与实际结果高度一致,尤其在中等概率区间(如50%、70%)内,能够为临床提供更具参考价值的诊断信息。而SVM模型虽然在AUC上表现突出,但其系统性偏差可能影响临床医生对患者风险的准确判断。因此,未来研究需要进一步优化模型的校准能力,以确保其在实际临床应用中的可靠性。

本研究还通过热图(Heatmap)对关键舌象特征进行了可视化分析,发现舌质的纹理均匀性、舌体的形态特征和颜色深度是区分正常与甲状腺功能减退状态的重要指标。这些特征与中医“望舌”理论中的“观色、察形、辨苔”高度契合,进一步验证了舌象特征在AI辅助诊断中的可行性。此外,研究发现,舌象特征的改变与HT的病理生理机制密切相关,例如甲状腺功能减退时基础代谢率降低、水分滞留和血液循环减缓等,这些变化在舌象热图中得以体现,说明AI模型能够有效捕捉舌象的病理特征。

尽管本研究取得了一定成果,但仍存在一些局限性。首先,研究数据主要来自中国两个省份的医疗机构,虽然具备一定的地域代表性,但尚未覆盖更广泛的人群,因此模型的泛化能力仍有待进一步验证。其次,舌象特征的提取过程可能受到多种外部因素的影响,如饮食习惯、口腔卫生等,这些因素虽然在研究中被部分控制,但仍可能对舌象图像产生细微影响。因此,未来研究需要在数据采集阶段更加全面地纳入这些潜在的混杂因素,并通过更精细的特征工程和模型优化来提高分类的准确性。

此外,本研究主要关注HT患者的甲状腺功能状态分类,未来可以进一步扩展模型的应用范围,例如纳入健康对照组或非HT导致的甲状腺功能减退患者(如碘缺乏或甲状腺切除术后患者),以构建多分类模型,提高其在临床中的适用性。同时,结合多模态医疗数据(如血液检测、超声图像等)进行联合建模,可能有助于提高模型的诊断准确性和临床实用性。这不仅能够增强AI模型对HT及甲状腺功能减退症的识别能力,还能为患者提供更全面的健康评估和个体化管理方案。

总体而言,本研究通过机器学习技术,成功构建了一个基于舌象特征的辅助诊断模型,为HT及甲状腺功能减退症的早期识别和疾病监测提供了新的思路和工具。该模型不仅具有非侵入性、低成本和易操作的优势,还能为基层医疗机构提供智能化的诊断支持,提高疾病的早期发现率和诊断效率。未来的研究应进一步优化模型的泛化能力和临床适用性,以推动舌象辅助诊断技术在更广泛人群中的应用,并为人工智能在传统医学领域的融合提供更坚实的科学依据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号