
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Segment Anything Model的超声心动图左心室分割:基础模型与领域专用模型的效能比较
【字体: 大 中 小 】 时间:2025年06月07日 来源:npj Digital Medicine 12.4
编辑推荐:
为解决超声心动图左心室(LV)分割中模型泛化性不足和标注成本高的问题,斯坦福大学团队通过微调Segment Anything Model(SAM),在EchoNet-Dynamic数据集上开发了高效分割模型。研究显示,微调SAM112 在外部验证集(TTE/POCUS)中DSC达0.911±0.045,较EchoNet提升19%,且标注时间减少50%。该研究为医学影像分析提供了数据高效的通用模型优化策略,发表于《npj Digital Medicine》。
超声心动图是心脏病学中最常用的无创影像技术,但左心室(LV)分割仍面临两大挑战:一是传统人工标注存在7%-13%的观察者间变异,二是现有AI模型如EchoNet依赖大量标注数据且泛化性不足。尤其对于新兴的点式超声(POCUS),图像质量差异更大,亟需开发适应性强的解决方案。
斯坦福大学医学院与计算机科学团队在《npj Digital Medicine》发表研究,创新性地将Meta AI的通用分割基础模型Segment Anything Model(SAM)引入医学领域。通过微调SAM的ViT-base版本(输入尺寸112×112,简称SAM112
),使用EchoNet-Dynamic数据集的7460例经胸超声(TTE)视频帧,并与MedSAM、U-Net等模型对比。研究发现,微调SAM在外部验证集(包括梅奥诊所的58例TTE和41例POCUS)中展现出显著优势:在CAMUS数据集A2C视图上,DSC达0.891±0.040,较EchoNet提升18.5%(p<0.0001);POCUS数据上DSC 0.857±0.047,优于EchoNet的0.667±0.279。更令人振奋的是,SAM辅助标注使人工耗时减少50%(5.7±1.7秒 vs 11.6±4.5秒),且医学学生标注质量提升66%。
关键技术包括:1)基于EchoNet-Dynamic公开数据集(10,030例A4C视图视频)和梅奥诊所99例患者数据;2)采用边界框提示的SAM零样本评估与微调策略;3)Dice损失和交叉熵损失的复合损失函数优化;4)人类标注实验设计验证临床实用性。
主要结果
零样本性能验证
SAM在未微调状态下,EchoNet测试集DSC已达0.863±0.053,显示基础模型对医学影像的潜在适应性。但POCUS数据表现波动较大(DSC 0.861±0.043),提示微调必要性。
微调模型效能突破
SAM112
微调后性能全面提升:在梅奥TTE数据中DSC 0.902±0.032,较零样本提升2.3%;LVEF计算误差(MAE)从11.67%降至7.52%。值得注意的是,其对A2C视图(CAMUS)的泛化能力突出,DSC达0.891±0.040,显著优于专为A4C设计的EchoNet(0.752±0.196)。
跨模型对比
与MedSAM相比,SAM112
在多数数据集领先2-5%(p<0.0001)。当输入尺寸统一为1024×1024时,SAM1024
与微调MedSAM性能相当(DSC 0.935 vs 0.936),证实基础模型通过微调可达到专用模型水平。
临床工作流优化
人类标注实验显示,SAM辅助使专家标注时间缩短39.2%,医学生耗时减少66%,且DSC保持稳定(0.84±0.07 vs 0.84±0.08)。
讨论与意义
该研究首次证明:1)通用视觉基础模型通过小样本微调(<8000例)即可超越专用模型,打破医学AI需百万级数据的传统认知;2)SAM的交互式设计可实现"人在环路"(human-in-loop)标注,为临床落地提供新范式;3)在图像质量较差的POCUS场景中,微调SAM展现出显著鲁棒性,这对急诊和基层医疗具有重要价值。
局限性在于仅评估ED/ES单帧而非全视频分析,且未探索时空特征融合。未来工作可结合时序建模进一步提升精度。这项研究为医学影像分析提供了可推广的框架——"基础模型+领域微调",其50%的标注效率提升可能加速高质量医学数据库的构建,最终助力精准心血管诊疗。
生物通微信公众号
知名企业招聘