面向低资源场景的甲状腺结节恶性风险预测:基于PubMedCLIP的可解释多模态机器学习模型
《BMC Endocrine Disorders》:An interpretable multimodal machine learning model for predicting malignancy of thyroid nodules in low-resource scenarios
【字体:
大
中
小
】
时间:2025年10月18日
来源:BMC Endocrine Disorders 3.3
编辑推荐:
本研究针对低资源环境下甲状腺结节良恶性鉴别诊断难题,开发了一种融合超声图像与甲状腺功能数据的多模态机器学习模型。研究人员创新性地采用PubMedCLIP预训练模型提取超声图像特征,结合临床指标构建集成分类器,结果显示AdaBoost算法表现最优(AUC=0.732),特征重要性分析揭示FT4、FT3和图像特征clip_feature_184为关键预测因子。该研究为临床决策支持提供了可解释的人工智能工具,显著提升了个体化风险评估精度。
甲状腺结节是内分泌系统最常见的临床问题之一,全球发病率持续攀升。随着超声技术的普及,人群中甲状腺结节的检出率高达50%-70%,但其中仅7%-15%可能发展为甲状腺癌。如何准确区分结节的良恶性,避免不必要的穿刺活检,同时又不漏诊恶性病例,成为临床实践中的重大挑战。
目前甲状腺结节的诊断主要依赖三步法:功能检测、彩色超声检查和穿刺活检。然而这些方法高度依赖医师经验,存在主观判断差异,且标准流程需要同时结合实验室检查和影像学评估。现有的人工智能研究多聚焦于单一模态数据,特别是超声图像分析,忽视了临床实践中常规采集的甲状腺功能指标的重要价值。更关键的是,医疗领域常面临数据稀缺困境——伦理限制、患者隐私保护、罕见病例收集困难等因素都制约着大规模高质量数据集的构建,而传统监督学习模型又需要专家标注,这在低资源场景下尤为棘手。
正是在这样的背景下,马富强团队在《BMC Endocrine Disorders》发表了创新性研究,提出了一种基于PubMedCLIP的可解释多模态机器学习模型,专门针对低资源环境下的甲状腺结节恶性风险预测问题。
研究团队采用了几项关键技术方法:首先从湖北中医药大学附属医院收集672例患者的临床资料构建队列数据集;接着利用PubMedCLIP预训练模型(基于医学文献图像训练)提取超声图像的512维特征向量;然后将图像特征与甲状腺功能指标(FT3、FT4、TSH、TgAb、TPOAb)及年龄性别信息融合为519维综合特征;最后通过七种机器学习算法(包括AdaBoost、随机森林等)进行性能比较,并采用SHAP方法进行特征重要性分析和模型可解释性验证。
demographic characteristics
研究纳入了672例患者,包括348例经手术确诊的甲状腺癌和324例随机选择的甲状腺结节病例。患者平均年龄44.26±12.47岁,男女比例1:3.94。统计分析显示,良恶性结节组在年龄、性别、FT4和TPOAb指标上存在显著差异(P<0.05),这为后续模型构建提供了重要的基线特征依据。
在仅使用甲状腺功能数据的初步实验中,七种机器学习模型的AUC值介于0.552-0.709之间,其中AdaBoost classifier表现最优(AUC=0.709),因此被选为基准模型。这一结果表明,单纯的临床数据已具备一定的预测能力,但仍有提升空间。
The final model selection
当加入PubMedCLIP提取的超声图像特征后,所有模型的性能均得到显著提升。特别值得注意的是,逻辑回归模型(Logistic Regression)结合CLIP特征后表现突出,AUC从0.634提升至0.732,准确率、F1分数等指标也同步改善。与传统的图像分类算法(如VGG、ResNet等)相比,CLIP增强模型展现出明显优势,证明了多模态融合策略的有效性。
通过SHAP值分析,研究人员深入解读了模型的决策机制。在仅使用甲状腺功能数据时,FT4、FT3等指标对预测结果的贡献度存在较大差异,模型过度依赖少数几个关键指标。而加入CLIP图像特征后,特征重要性分布更加均衡,FT4和FT3的重要性保持稳定,其他特征的贡献度相对均匀,表明图像特征的引入为模型提供了互补信息,降低了对单一模态数据的依赖性,增强了分类稳健性。
这项研究的创新价值体现在多个层面。方法学上,它巧妙利用了对比学习范式中的CLIP架构,通过预训练模型解决医疗图像标注数据稀缺的难题。PubMedCLIP在大量医学图像-文本对上训练而成,具备强大的零样本学习能力,能够直接从超声图像中提取有意义的特征表示,无需针对特定任务进行大量标注数据训练。
实践意义上,该研究紧密贴合临床工作实际流程,同时利用了甲状腺功能检验和超声影像这两种常规检查数据,使模型更容易整合到现有诊疗体系中。研究明确处于低资源场景的定位,通过多模态数据融合提升小样本条件下的模型性能,这对医疗资源分布不均的地区尤其具有参考价值。
可解释性方面,研究采用SHAP方法破解机器学习"黑箱"难题,让临床医生能够理解模型的决策依据。特征重要性分析不仅增强了结果的可信度,还揭示了FT4、FT3和特定图像特征(clip_feature_184)在甲状腺癌风险评估中的关键作用,这与部分既往研究发现的甲状腺激素水平与恶性风险间的关联相呼应。
研究的局限性同样值得关注。作为单中心研究,样本代表性可能受限;不同超声设备的图像差异也可能影响模型泛化能力。作者建议未来进行多中心验证以进一步评估临床适用性。
总体而言,这项研究为甲状腺结节的精准诊断提供了新思路。通过创新性地融合多模态数据和可解释人工智能技术,不仅在低资源条件下实现了良好的预测性能,更重要的是建立了医生与算法之间的信任桥梁。随着人工智能在医疗领域的深入应用,这种既注重性能又关注可解释性的研究方法,将为临床决策支持系统的实际落地提供重要借鉴,最终推动甲状腺疾病管理向更加个性化、精准化的方向发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号