基于SPECT/CT图像自监督学习与影像组学融合的良恶性骨病灶诊断研究
《Journal of Bone Oncology》:Benign and malignant bone lesion diagnosis based on self-supervised and radiomics fusion using SPECT/CT images
【字体:
大
中
小
】
时间:2025年11月02日
来源:Journal of Bone Oncology 3.5
编辑推荐:
本研究针对SPECT/CT成像在骨病灶良恶性鉴别诊断中主观性强、准确性不足的临床难题,创新性地提出了SPARC-Net框架,通过融合SPECT引导的自监督深度学习与CT影像组学特征,实现了82.3%的诊断准确率和0.890的AUC值,显著提升了骨肿瘤诊断的客观性和可靠性,为临床决策提供了更精准的AI辅助工具。
在肿瘤诊疗领域,骨转移是晚期实体瘤患者最常见的并发症之一,尤其多见于乳腺癌、前列腺癌和肺癌患者。骨转移不仅意味着疾病进展,更与一系列严重临床后果密切相关,如顽固性疼痛、活动功能障碍以及病理性骨折、脊髓压迫、高钙血症等骨骼相关事件。这些并发症显著降低患者生活质量,使治疗策略复杂化,凸显了早期准确识别骨转移的临界重要性。
然而,恶性骨病灶在影像学上常与良性病变(如骨关节炎、骨梗死、炎症等)表现出高度相似的影像特征,即使经验丰富的放射科医师也面临准确诊断的巨大挑战。可靠区分良恶性病灶对指导恰当治疗方案至关重要,但病灶形态或解剖位置的细微差异往往难以提供确定性诊断线索,增加了临床决策的不确定性。
99m99mTc-MDP SPECT/CT已成为广泛应用的成像技术,它将SPECT的代谢敏感性与CT的高分辨率解剖细节相结合,理论上为骨病灶表征提供了更全面的视角。但在临床实践中,SPECT/CT图像解读仍高度依赖专家视觉评估,引入了主观性和诊断变异性,特别是在示踪剂摄取模糊、边缘性病灶或伴随退行性改变的情况下,导致可重复性和临床可靠性受限。
影像组学作为从医学图像中提取大量定量特征的技术,已成为提高诊断客观性和准确性的有效工具。通过表征病灶异质性,影像组学有望提升基于图像的诊断精度。然而,影像组学方法依赖手动特征提取和精确病灶分割,这些过程耗时且依赖于操作者专业水平。此外,影像组学在建模全局语义上下文方面的局限性及其对图像质量和成像协议的敏感性,进一步限制了其广泛应用。
与影像组学相比,深度学习特别是卷积神经网络(CNN)提供了强大替代方案,能够从原始图像数据中自动学习层次化特征。深度学习不依赖预定义特征,在医学图像分类任务中表现出卓越性能。由于标记数据集稀缺,迁移学习被广泛用于将自然图像上训练的模型适配于医学图像分析。然而,自然图像与医学图像之间的领域差距常常影响模型泛化能力,特别是在骨病灶分类等专业任务中。
近期,自监督学习方法作为一种创新策略出现,能够无需标记数据而从图像中学习潜在有用信息。通过在未标记数据上解决预定义任务,自监督模型可以发现对下游任务有益的潜在结构特征。然而,现有自监督方法通常是单模态的,缺乏临床语义的有效整合,限制了其在复杂解剖背景中的有效性。
为克服这些局限性,研究人员提出了一种创新的双阶段特征建模框架,将手工影像组学特征与SPECT引导的自监督深度学习模型相结合。具体而言,他们引入了SPARC-Net(自监督特征提取器和跨模态融合网络),这是一种利用SPECT图像代谢信号作为语义先验的自监督框架,可指导从CT图像中提取全局判别特征,而无需人工标注。随后,将这些深度特征与传统影像组学描述符融合,创建统一表征,捕捉局部结构细节和全局语义上下文。这种多尺度、多源融合方法显著增强了良恶性骨转移分类的准确性、鲁棒性和可解释性。
本研究回顾性分析了2021年1月1日至2024年6月30日期间在某三级医疗中心接受SPECT/CT检查的741例患者的临床和影像数据。所有患者均经病理、影像或临床随访确诊为骨转移或良性骨病变。成像数据使用西门子SPECT/CT扫描仪采集,配备低能量高分辨率(LEHR)准直器和16层螺旋CT系统。每位患者静脉注射740-925 MBq的99m99mTc-MDP,注射后3-4小时进行全身骨显像,随后立即对异常示踪剂摄取区域进行靶向SPECT/CT成像。
图像预处理阶段,所有病灶图像以BMP格式导入3D Slicer,选择病灶最大横截面积的轴位切片进行分析。由训练有素的核医学医师在SPECT、CT和融合SPECT/CT图像上手动勾画异常示踪剂摄取对应的感兴趣区域,每位标注均由具有3-5年临床经验的高年资医师审核验证。图像被裁剪至仅保留目标区域,调整至224×224像素统一分辨率,像素强度值归一化至0-1范围。
SPARC-Net作为核心模块,采用自监督预训练方法和多源信息融合架构学习图像的全局语义表征。它使用共享的EfficientNet编码器处理SPECT和CT图像,通过1×1卷积核将单通道灰度输入转换为三通道格式。编码器为每种模态提取全局特征向量,语义对齐机制最小化模态差异。CT分支包含高级解码器结构用于空间重建特征向量,提升图像清晰度和模型可解释性。模型以完全自监督方式训练,无需人工标注,结合跨模态对齐损失和多尺度图像重建损失优化特征提取和重建质量。
影像组学分析使用PyRadiomics库从预处理病灶区域提取三大类特征:基于形状的特征(Shape2D)、一阶统计特征和基于灰度共生矩阵(GLCM)的纹理特征。形状特征量化病灶几何结构,捕捉伸长率、扁平度、长短轴长度、周长和球形度等指标;一阶特征描述感兴趣区域内体素强度分布,包括均值、方差、熵、峰度和偏度等度量;GLCM纹理特征表征像素强度的空间关系,捕捉对比度、同质性、相关性和纹理熵等参数。
为增强模型可解释性并减少高维影像组学特征空间中的冗余,研究采用LinearSVC算法进行特征选择。该算法基于每个特征对决策边界的贡献分配权重,权重绝对值越高表明判别能力越强。根据权重绝对值降序排列特征,从每种模态中选择前30个最具信息量的特征。
性能评估采用五折交叉验证,计算准确率、灵敏度(SN)、特异度(SP)、假阳性率(FPR)、假阴性率(FNR)、精确率和F1分数等指标,并引入受试者工作特征曲线下面积(AUC)作为综合判别能力度量。
通过系统比较五种特征表征方法发现,SPARC-Net特征与影像组学特征融合的策略表现最优。使用逻辑回归分类器时,这种混合特征表征达到0.890的AUC、82.3%的准确率、72.3%的F1分数、66.6%的灵敏度和90.7%的特异度,显著优于单一模态模型。SPARC-Net独立使用时AUC为0.804,优于传统迁移学习模型的0.771,表明SPECT引导的自监督机制增强了模型对CT图像中病灶区域的语义感知能力。
融合策略的比较显示,SPARC-Net单独使用的最佳分类阈值为0.310,影像组学为0.360,而融合模型达到0.450。更高的阈值表明融合模型具有更强的判别稳定性。配对差异检验表明,融合模型的灵敏度显著高于SPARC-Net模型(t=-2.886,p=0.045),特异度也显著优于SPARC-Net和影像组学模型(t=-4.237,p=0.013;t=-6.035,p=0.004)。McNemar检验显示融合模型与其他两种模型的分类结果存在显著差异,证实了其优越的分类稳定性。
通过系统移除SPECT引导分支和重建分支评估关键模块功能。移除引导分支导致所有指标显著下降,特别是AUC和灵敏度,证实SPECT衍生的语义先验对模型关注诊断相关区域至关重要。移除重建分支也导致性能下降,但程度较轻,表明空间重建不仅规范特征学习,还强化编码表征的结构完整性。完整SPARC-Net模型整合两种策略,实现了最平衡和鲁棒的分类性能。
按解剖部位、原发恶性肿瘤和病灶类型进行亚组分析显示,模型在各亚组中保持强大判别能力(AUC 0.881-0.938)。脊柱亚组特异度最高(98.4%),长骨亚组灵敏度突出(68.4%)。乳腺癌亚组AUC最高(0.934),前列腺癌亚组灵敏度达95.7%,肺癌亚组AUC达0.938。按病灶类型分析,溶骨性病灶特异度高(94.9%),硬化性病灶灵敏度优先(94.7%),混合性病灶在灵敏度和特异度间保持平衡。
在包含75例患者病例(26例恶性,49例良性)的独立验证中,模型达到80.0%的准确率、0.873的AUC、69.4%的精确率、65.4%的灵敏度和87.8%的特异度,证实了其在独立数据上的强大且稳定的诊断性能。
重建输出与原始CT图像、SPECT扫描和病灶区域的视觉比较显示,模型生成图像主要聚焦于SPECT扫描中高代谢的病灶区域,同时抑制无关解剖结构(如周围器官和正常骨组织)。重建输出在保持骨骼整体结构完整性的同时,提高了高代谢病灶区域的清晰度和对比度,表明SPARC-Net有效优先处理关键病理区域。
通过Grad-CAM可视化显示,SPARC-Net的激活响应与SPECT扫描标记的高代谢区域在空间上高度一致。模型能够一致识别良恶性病例中的关键诊断区域,反映了其强大的病灶定位能力和决策过程的可解释性。这些发现验证了模型的判别有效性,为其在临床诊断应用中的可靠性和透明度提供了有力证据。
该研究证实了整合SPECT引导的深度学习与影像组学在良恶性骨病灶准确分类中的有效性。较高的AUC、准确率和灵敏度等诊断性能指标凸显了该模型在增强病灶表征、提高诊断精度和减少骨转移检测假阳性方面的潜力。通过结合SPARC-Net自监督学习的语义能力与影像组学的强大特征提取能力,该框架在定位关键病灶区域和保持全局结构完整性方面均表现出色。
SPARC-Net聚焦临床显著区域的能力,通过Grad-CAM可视化得到证实,提供了清晰的可解释性,增强了AI辅助决策的可信度。该模型不仅提高了分类性能,还提供了对病灶特异性模式的关键见解,使其成为临床决策支持的宝贵工具。
未来研究应侧重于使用更大规模、多中心数据集验证这些发现,以增强模型的泛化能力和鲁棒性。应优先将SPARC-Net整合到临床工作流程中,特别是用于骨转移的个性化治疗规划。进一步研究其在多模态成像融合、实时临床性能以及应用于其他肌肉骨骼疾病方面的潜力,将扩展其效用。为将诊断准确性提高到近乎完美的水平,扩展数据集以覆盖更广泛的病例范围,并探索集成学习或强化学习等先进技术可能有益。整合额外临床数据(如患者病史或遗传标记)可能改善情境感知诊断。此外,实时性能以及持续的临床医生反馈,对于完善模型以适应临床应用至关重要。虽然当前模型显示出巨大潜力,但在临床环境中进行持续验证和改进,对于满足常规使用所需的严格标准至关重要。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号