优化CT冠状动脉分割的泛化深度学习模型:多因素评估揭示图像质量与钙化影响

【字体: 时间:2025年09月20日 来源:Journal of Imaging Informatics in Medicine

编辑推荐:

  本研究针对CT冠状动脉造影(CTCA)中深度学习模型泛化性能受图像质量与钙化影响的问题,系统评估了动脉对比增强、边缘锐度及钙化程度对分割精度的影响。研究发现动脉对比增强(r=0.408, p<0.001)和边缘锐度(r=0.239, p=0.046)与DSC呈正相关,而低钙化组对分割性能影响最显著(p<0.05)。该研究为开发跨中心泛化模型提供了数据驱动的优化策略,对提升CAD诊断自动化具有重要意义。

  

在全球范围内,冠状动脉疾病(CAD)始终是导致死亡和疾病负担的首要原因,其发病率持续攀升。非侵入性的计算机断层扫描冠状动脉血管造影(CTCA)技术在可视化冠状动脉和心脏组织方面发挥着关键作用,有助于CAD的检测和管理。从CTCA扫描中精确分割冠状动脉,是当前新兴研究的关键步骤,例如通过勾勒动脉腔来实现解剖测量和血流分析。近年来,深度学习技术的飞速进展推动了能够自动从CTCA中高精度分割冠状动脉的算法发展。

尽管基于深度学习的分割方法在简化研究流程和提升诊断能力方面具有巨大潜力,但训练这类模型仍需要大量手动或半自动标注进行测试、验证和确认。私有数据集的标注过程极其耗时且资源密集。因此,研究人员持续探索利用预标注的公共数据集进行模型训练,并随后应用于未标注的私有数据集的方法。然而,基于开源数据集训练的深度学习分割模型在应用到私有数据集时,其准确性往往下降,这源于数据集的变异性、不同机构使用不同成像协议和设备导致的图像特征差异、患者间信号强度的变化,以及患者特异性因素(如疾病严重程度和不同种族人群)。疾病严重程度,特别是钙化的存在,显著影响分割性能。与动脉粥样硬化斑块相关的钙化已被确定为使用CTCA进行冠状动脉分割时误差的主要来源之一,因为钙化病变会导致 blooming artifacts( blooming伪影),引起受影响区域腔隙强度升高。这些发现与本文的关注点相吻合,表明钙化会持续损害不同成像技术下的分割准确性。

以往的研究尚未系统考察不同水平的钙化对分割性能的影响程度。探究这一方面可以为针对不同疾病分布的模型适应提供更精准的方法。冠状动脉的解剖结构存在显著差异,即使在同一种族人群中也如此,这影响了成像特征和分割准确性。例如,研究表明印度人群的冠状动脉段尺寸小于其他大陆研究报告的尺寸。此外,虽然冠状动脉通常被一层脂肪包围,但在某些个体中,它们可能直接嵌入心肌内,这影响了其解剖背景。然而,尚无研究专门识别出最可能导致模型在不同数据集上分割性能下降的冠状动脉结构几何变异。弥补这一空白对于提高模型泛化能力和确保在不同临床环境中可靠的分割性能至关重要。

尽管已有研究考察了成像协议及其效果,但仍不清楚这些特定参数是否已被系统评估与模型在不同数据集上性能的关系。若干研究探索了医学分割任务中图像质量的个别方面。例如,一项研究测量了对比噪声比(contrast-to-noise ratio),并证明CT图像中的去噪可以增强血管结构分割。类似地,另一项研究提出了一种针对低对比噪声比图像的预滤波方法,显示该方法显著改善了3D CT血管造影图像中的肝血管分割。还有研究调查了不同水平的对比增强及其对冠状动脉中心线提取(一种常见分析任务)的影响,发现改进的对比增强能带来更好的提取性能。此外,研究提示由于造影剂的注射,动脉体素强度随时间发生显著变化,强调对比增强取决于造影剂注射与成像之间的时间间隔,而这在临床环境中是变化的。改进的边缘锐度(edge sharpness)也被证明对各种分割任务有益。例如,开发了一种专门的Sharpness-Aware模型用于视网膜血管分割,证明了其在提高分割准确性方面的有效性。另一项研究发现边缘锐度在脑室分割中起着关键作用。尽管有这些研究,评估对比噪声比、动脉对比增强和边缘锐度对基于深度学习的冠状动脉分割模型在不同数据集上影响的研究仍然有限。

除了对图像特征的调查外,还提出了若干基于深度学习的方法来改善分割泛化能力。例如,在对比增强心脏磁共振成像(MRI)和心脏电影MRI中,研究人员证明了数据增强策略可以提高跨临床中心的分割鲁棒性。此外,引入了一种元学习框架来识别源数据集和未见数据集之间与域偏移相关的表示,从而在低数据设置中改善泛化能力。尽管这些策略突出了其他成像模态的进展,但它们在CTCA中的应用仍然相对有限,特别是因为影响CTCA分割性能的具体因素尚未被系统表征。

本文研究了使用CTCA扫描时,特定图像因素和特定冠状动脉形状如何影响冠状动脉分割模型的泛化能力。这项工作考察了图像属性,包括对比噪声比、动脉对比增强和边缘锐度,作为可能影响模型泛化能力的潜在因素。此外,我们还考虑了患者特异性因素,如冠状动脉的几何形状(平均绝对曲率和平均直径)以及冠状动脉中钙化的严重程度。我们使用dice相似系数(dice similarity coefficient, DSC)评估了两个不同数据集上的分割性能,首先在公开的ASOCA数据集上训练和验证深度学习模型,然后在私有的GeoCAD数据集上测试它们,以评估模型的泛化能力。本研究并非提出新的模型架构,而是旨在系统评估现有深度学习模型在具有不同图像特征、解剖特征和钙化严重程度的数据集上的泛化能力。模型评估的这一方面在当前文献中仍未得到充分探索。

为开展本研究,研究人员主要应用了以下关键技术方法:研究利用了公开的ASOCA数据集(40例)和私有的GeoCAD数据集(70例,源自澳大利亚悉尼Spectrum Medical Imaging的多中心回顾性队列)。图像质量量化包括使用特定算法计算对比噪声比(CNR)、动脉对比增强和边缘锐度。冠状动脉分割采用三种深度学习架构:nnU-Net、Swin-UNETR和EfficientNet-LinkNet,均经过五折交叉验证训练,并通过集成策略(软集成或多数投票)合并结果。分割性能通过DSC评估,并采用Pearson相关系数分析图像特性、钙化水平及动脉几何特征(直径、曲率)与DSC的相关性,统计显著性阈值设定为p<0.05。

图像特征与冠状动脉树分割

通过DSC评估在ASOCA和GeoCAD上冠状动脉树的分割性能。正如预期,ASOCA显示出轻微优势,得分约为0.9,而GeoCAD得分约为0.8。这是因为模型使用ASOCA进行了五折交叉验证的训练和评估。显著差异表明,使用训练好的模型预测GeoCAD会导致较低的分割性能。我们的比较分析检查了数据集中三种图像质量指标的差异:对比噪声比、动脉对比增强和边缘锐度(图2)。总体而言,我们发现除动脉对比增强外,所有指标均存在显著差异。这表明ASOCA和GeoCAD都具有相似的增强动脉CTCA对比度。

为了进一步探索影响分割性能的因素,我们研究了GeoCAD测试数据集中DSC与三个图像质量指标之间的相关性(表3)。分析重点在于理解图像特征的变化如何影响模型准确性。具体而言,动脉对比增强与DSC呈现强正相关(Pearson相关系数r=0.408,p值<0.001),表明较高的动脉对比增强与较高的DSC值相关。类似地,边缘锐度与DSC正相关(r=0.239,p=0.046),提示更锐利的边缘有助于提高DSC。虽然对比噪声比也与DSC呈现正相关(r=0.201),但这种关系在统计上不显著(p=0.095)。

疾病与冠状动脉树分割

我们通过比较ASOCA和GeoCAD数据集在不同钙化水平下的DSC,评估了钙化对冠状动脉树分割性能的影响(表4)。当在ASOCA数据集的保留集上进行测试时,深度学习模型表现出较高的分割准确性,在不同钙化水平下实现的DSC范围从0.85±0.10到0.90±0.03。然而,当在外部GeoCAD数据集上进行测试时,在钙化较轻的组中性能略有下降。具体而言,无钙化组的DSC从0.90±0.03下降到0.82±0.07,低钙化组的DSC从0.86±0.03下降到0.79±0.09。

对每个钙化水平进行Welch's t检验以评估ASOCA和GeoCAD组之间的统计显著性。在无钙化和低钙化水平中发现 statistically significant differences(统计显著差异)(p<0.05),而中度和高度钙化水平的差异在统计上不显著。这些发现表明,当在未见过的数据集上进行测试时,分割性能对细微的钙化更为敏感。这些区域可能更难以检测和分割,因为与中度和高度钙化相比,它们的沉积物更小、更不明显。这些细微特征更可能被对比度掩盖,并且模型难以准确检测和排除。此外,GeoCAD数据集是使用更现代的扫描仪采集的,运动伪影减少。采集质量的这种不匹配可能进一步影响模型的泛化能力,特别是对于对运动伪影更敏感的小钙化斑块。

冠状动脉段分析

我们通过关注各种冠状动脉段,进一步评估了在ASOCA数据集上训练和验证的模型随后在GeoCAD数据集上测试的分割准确性:左主干(LM)、左前降支(LAD)、左回旋支(LCx)、第一对角支(D1)、第一钝缘支(OM1)和右冠状动脉(RCA),如图3所示。为了解释已知的性别相关冠状动脉解剖差异,特别是在女性受试者中通常观察到的较小动脉直径,我们按性别对分析进行了分层。所有分段性能比较均在性别组内进行(即ASOCA男性与GeoCAD男性比较,ASOCA女性与GeoCAD女性比较)。如“材料与方法”部分所述,在从CTCA图像获得初始动脉分割后,将其转换为网格以便在VMTK中处理。使用VMTK在网格级别进行血管分割。然后使用分割后的网格映射并将包含的点标识回原始CTCA分割域,确保在二值图像上下文中准确计算DSC。

这项比较分析旨在确定解剖变异对深度学习模型测试性能的影响。我们的研究结果显示,当应用于GeoCAD测试数据集时,模型的分割DSC对不同动脉段的解剖特征敏感。如图3所示,在ASOCA数据集上训练和验证的分割模型通常在ASOCA受试者(图3,蓝色柱)上比在GeoCAD受试者(图3,橙色柱)上表现更好,这在男性和女性组中均如此。这种性能差距在LM、LAD、LCx(这些对于向主要心脏区域供应含氧血液至关重要)和D1段中最为明显,其中GeoCAD组的DSC显著较低,尤其是女性。尽管OM1和RCA段在数据集之间未显示显著差异,但跨段的整体趋势凸显了将模型性能泛化到外部数据集的挑战,特别是当存在解剖变异时。这一结果表明,段特异性和性别特异性的解剖差异可以显著影响分割准确性。

我们基于真实标注(ground truth annotations)分析了动脉几何形状,以进一步探索数据集间的解剖差异。ASOCA和GeoCAD在各段上显示出大致相似的平均动脉直径,其四分位距有 substantial overlap(显著重叠)(图4)。两个数据集中的女性受试者都具有 consistently smaller diameters(持续较小的直径)和较高的曲率。然而,GeoCAD中的直径分布更加多样化。ASOCA和GeoCAD之间的曲率差异比直径差异更明显。在女性LAD(p<0.05)、D1(p<0.05)和OM1(p<0.05)中观察到显著的曲率变异,GeoCAD表现出更大的变异性和更高的中位曲率。这些几何形状上的差异与分段性能下降(图3)相符。

基于GeoCAD数据集真实标注的相关分析为了解解剖特征(特别是冠状动脉段的平均直径和曲率)如何影响分割模型的准确性提供了理解(表5)。在女性受试者的LM段中,LM直径与LM DSC之间存在正相关(系数,0.429;p值,0.008),表明较大的直径与该段较高的DSC相关。然而,LM曲率对LM DSC的影响极小,表明它对于LM段的分割准确性不太关键。相反,直径和曲率都与LAD段的DSC呈现弱相关性,表明这些几何特征对分割准确性的影响很小或没有影响。LCx段显示直径与DSC之间存在弱正相关,暗示直径大小可能对分割准确性有潜在影响。该段内的曲率与DSC呈现负相关。男性受试者的OM1(系数,0.470;p值,0.036)和女性受试者的RCA(系数,0.640;p值,<0.001)均表现出直径与DSC之间的强正相关,强化了较大动脉直径对分割准确性有积极贡献的观点。然而,这些段中的曲率似乎对DSC的影响可忽略不计,表明它可能不是这些区域分割准确性的关键因素。

本研究的主要结论强调,提升冠状动脉分割模型的泛化能力需综合考虑新数据集的成像质量、疾病相关伪影和解剖变异。研究发现动脉对比增强和边缘锐度与测试案例中的Dice相似系数呈正相关。同时,所有程度的钙化均对DSC产生负面影响,其中低钙化水平引起的下降具有统计显著性。此外,特定动脉分支的直径与DSC显示出显著相关性。解决数据集间的差异,特别是在图像和患者特征方面,对于推进该领域基于深度学习的分割模型能力至关重要。讨论部分进一步指出,尽管在非对比成像模态的泛化方面已有进展,但针对对比增强成像(如CTCA)的专门泛化技术仍需更多探索。动脉对比增强和边缘锐度不仅可 retrospective(回顾性)评估,还能为前瞻性成像协议设计提供信息,例如采用更锐利的重建内核和运动补偿技术。钙化,尤其是低钙化病变,由于与明亮腔隙的对比不明显,对分割准确性构成显著挑战。解剖变异,特别是动脉直径和曲率的性别差异,是影响模型泛化性能的关键因素。未来工作应侧重于扩大数据集多样性、开发合成数据增强方法,以及采用预处理策略来对齐图像特征和处理钙化伪影,以构建更稳健、更通用的冠状动脉分割模型。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号