
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于基础模型的神经肌肉疾病MR图像多类肌肉分割准确性及不确定性比较研究
【字体: 大 中 小 】 时间:2025年09月02日 来源:Computational and Theoretical Chemistry 2.8
编辑推荐:
为解决神经肌肉疾病(NMDs)患者肌肉MR图像分割中脂肪浸润导致的边界模糊问题,研究人员开展了一项比较研究,评估了Segment Anything Model (SAM)和MedSAM两种基础模型(FMs)与nnU-Net在肌肉分割任务中的性能。研究发现,经过微调的SAM模型在中等和严重脂肪浸润病例中表现出更高的分割准确性(DSC: 0.886 vs 0.883和0.857 vs 0.850)和更好的校准性能(ECE: 3.6% vs. 5.1%和3.3% vs. 7.1%)。该研究为临床提供了一种更可靠的肌肉分割方法,特别适用于复杂病例的分析。
在神经肌肉疾病(NMDs)的诊断和治疗监测中,准确分割磁共振成像(MRI)中的骨骼肌(SM)组织至关重要。然而,随着疾病进展导致的脂肪浸润,肌肉边界变得模糊不清,给传统分割方法带来巨大挑战。尽管深度学习(DL)模型如U-Net及其变体已展现出潜力,但这些"黑箱"模型缺乏可靠的不确定性估计,难以满足临床对预测结果可信度的要求。与此同时,新兴的基础模型(FMs)如Segment Anything Model (SAM)因其强大的泛化能力和良好的校准特性,在医学图像分析领域展现出独特优势,但其在肌肉分割任务中的应用尚未得到充分探索。
为填补这一研究空白,Nicola Casali等研究人员在《Computational and Theoretical Chemistry》发表了一项开创性研究,系统比较了SAM、MedSAM与当前最先进的nnU-Net在NMD患者肌肉分割任务中的表现。研究团队从76名NMD患者中获取大腿MR图像数据集,按脂肪浸润程度分为早期、中期和严重三组。采用两种微调策略(仅解码器和编码器-解码器)对SAM和MedSAM进行优化,并与nnU-Net 2D和3D版本进行对比。通过Dice相似系数(DSC)评估分割准确性,同时采用期望校准误差(ECE)和负对数似然(NLL)量化不确定性。研究还引入深度集成(DE)技术来捕捉认知不确定性,为临床决策提供更全面的可靠性评估。
在方法学方面,研究人员创新性地将SAM和MedSAM改造为无需提示的多类语义分割模型,通过移除用户输入提示并修改输出头来适应12块肌肉加背景的分割任务。采用低秩自适应(LoRA)技术高效微调编码器参数,在保持模型性能的同时大幅减少可训练参数(仅234万)。为全面评估模型性能,研究不仅采用常规的DSC指标,还引入表面距离指标(ASSD和HD95)和不确定性量化指标(ECE和NLL),所有评估均在独立的测试集上进行,并针对不同脂肪浸润程度分组分析。
研究结果部分,"早期"组数据显示所有模型表现优异,nnU-Net 3D和SAM编码器-解码器(Enc/Dec)的DSC均达到0.925。在"中度"组中,SAM Enc/Dec以0.886的DSC超越nnU-Net 3D的0.883,同时展现出更好的校准性能(ECE 3.56% vs 5.09%)。"严重"组中,SAM Enc/Dec继续保持优势(DSC 0.857 vs 0.850),其不确定性图谱能有效识别脂肪浸润严重区域。值得注意的是,MedSAM并未表现出优于原始SAM的性能,这与预训练数据规模有限的假设相符。深度集成技术显著提升了所有模型的稳定性,特别是对过度自信的nnU-Net 2D改善明显。
在讨论部分,作者指出这项研究首次系统评估了FMs在肌肉分割任务中的不确定性量化表现。SAM展现的优越校准特性使其特别适合处理脂肪浸润导致的复杂边界问题,为临床决策提供了更可靠的支持。研究也揭示了几个重要发现:医学领域预训练(MedSAM)并未带来预期优势;2D的SAM模型能达到与3D nnU-Net相当的体积分割性能;深度集成在提升CNN校准性方面效果显著,但对已具备良好校准特性的FMs改善有限。这些发现对医学图像分析领域具有重要启示。
该研究的临床意义在于,通过结合基础模型的强大特征提取能力和系统的不确定性量化框架,为NMD患者的肌肉评估提供了一种更可靠的自动化工具。特别是在疾病进展监测和治疗效果评估中,准确且可信的分割结果能显著提高临床决策质量。未来工作可探索更多样化的数据集验证模型泛化能力,并研究3D版本的SAM架构以进一步提升体积一致性。这项研究不仅推动了肌肉影像分析技术的发展,也为医学领域更广泛地应用基础模型提供了重要参考。
生物通微信公众号
知名企业招聘