《Frontiers in Oncology》:Ultrasound viscosity imaging empowers BI-RADS: toward precise breast lesion diagnosis and analysis of HER2 status
编辑推荐:
本文探讨了超声粘度成像(UVI)在乳腺病灶良恶性鉴别及人类表皮生长因子受体2(HER2)状态无创评估中的应用价值。研究发现,将UVI衍生的最优粘性参数(V2.max)与乳腺影像报告和数据系统(BI-RADS)结合,能显著提升诊断性能。此外,研究首次揭示了病灶周围粘度参数与HER2阳性状态之间的潜在关联,为无创评估关键治疗靶点提供了新思路。
引言
乳腺癌是全球女性健康面临的一项重大挑战。早期筛查和个性化治疗对于改善患者预后至关重要。目前,组织活检虽然是区分乳腺病灶良恶性的金标准,但其侵入性不适于大规模筛查。作为主流的筛查手段,乳腺X线摄影也存在局限性,例如医疗资源受限以及在致密型乳房中敏感性显著降低。超声乳腺摄影作为补充,显示出相当的临床价值。其中,超声弹性成像被推荐作为BI-RADS的辅助手段,通过测量剪切波速度来间接推断组织弹性,从而提高传统超声的敏感性和特异性。
然而,传统超声弹性成像基于生物组织表现为纯弹性固体的假设。实际上,生物组织具有粘弹性特性,剪切波传播速度会随频率增加而增加(即频散现象),这不可避免地在临床实践中引入偏差。超声粘度成像(UVI)的发展解决了这一局限。它通过获取多个频率下的组织剪切波速度,并拟合到诸如Voigt模型的流变学模型中,从而计算定量的粘性参数(VPs),提供了对组织生物力学性质更全面的评估。先前研究已证实VPs与肝纤维化、炎症反应以及慢性肾病密切相关,突显了其在评估实质器官病理方面的临床潜力。
截至目前,仅有有限数量的研究探讨了UVI在区分乳腺病灶良恶性方面的价值。Jia等人的多中心研究系统地分析了UVI,创新性地将选出的最优粘性参数作为辅助评分来调整BI-RADS类别,证明了UVI的潜力。然而,该研究存在局限,例如没有开发新的、可解释的诊断模型,也未有研究分析VPs与人类表皮生长因子受体2(HER2)状态之间的相关性。因此,有必要对UVI在评估乳腺病灶方面的价值进行进一步研究。
材料与方法
研究对象:这项回顾性研究纳入了2024年12月至2025年5月期间在医院接受常规超声乳腺摄影和UVI检查,并随后获得芯针活检或手术病理结果的258名女性患者,共计274个乳腺病灶。病灶被随机以7:3的比例分为推导队列和验证队列。其中89个病灶进行了HER2检测,并根据免疫组织化学(IHC)/荧光原位杂交(FISH)结果分为阳性组和阴性组。
图像采集与分析:由两名经验丰富的超声医师使用迈瑞Resona A20s超声系统进行图像采集。所有操作均标准化,患者取仰卧位。首先进行常规超声成像,并根据病灶特征(如大小、形态、边缘、钙化)分配定量BI-RADS评分。随后切换至UVI模式,调整取样框,在患者屏气、探头稳定接触皮肤的情况下采集图像。图像需满足运动稳定性指数≥4星和可靠性指数≥95%的标准。使用系统内置的Shell软件包在灰度超声图像上勾画病灶轮廓,分析病灶核心以及周围1毫米和2毫米的边缘区域,基于Voigt模型和剪切波频散(SWD)模型计算VPs。所有VP值均为三次连续测量的平均值。
病理学评估:收集所有患者的芯针活检和手术切除病理报告,包括病理诊断和HER2状态结果。根据病理诊断将病灶分为良性或恶性。对于HER2评估,IHC评分为3分定义为HER2阳性,0或1分为阴性,2分病例需进一步进行FISH检测。所有评估均由两名经验丰富的病理医生独立完成。
亚组分析:病灶大小和患者年龄是疾病评估的基本参数。本研究将最大直径≤20毫米的病灶定义为小病灶,年龄≤45岁的患者定义为年轻组。基于这些标准,评估模型在不同亚组(按病灶大小和患者年龄分层)中的诊断性能。
统计分析:使用Boruta算法从推导队列的40个VPs中筛选出用于区分良恶性病灶的最优VP。随后构建了两个二元逻辑回归模型:原始BI-RADS模型(BI-RADS-O)和BI-RADS结合最优VP的模型(即粘度修正的BI-RADS模型,BI-RADS-V)。通过受试者工作特征曲线下面积(AUC)、校准曲线、Brier评分、Hosmer-Lemeshow(H-L)检验、净重分类改善(NRI)、综合判别改善(IDI)和决策曲线分析(DCA)等多个领域评估模型性能。使用广义估计方程进行敏感性分析以评估患者内病灶聚类的影响。在推导队列中完成所有分析后,在验证队列中验证BI-RADS-V的泛化能力。最后,对所有VPs进行单变量逻辑回归分析,探索其与HER2状态的关联。
可重复性分析:使用每个病灶的三次连续测量值,通过双向随机效应模型计算绝对一致性的组内相关系数(ICC)来评估关键超声粘度参数的观察者内可重复性。
结果
人口统计学特征:在推导队列和验证队列中,恶性组的年龄、病灶直径和BI-RADS评分均显著高于良性组(p < 0.05)。在推导队列中,除V1.mean、A’V1.mean、A’V2.mean、Dmin、D1.min、D2.min、A’D1.min和A’D2.min外,所有VPs均显示出统计学显著差异(p < 0.05)。而在验证队列中,仅有21个VPs(包括Vmax)显示出显著差异。
最优VP的选择:除A’V2.sd外,几乎所有VP都表现出强多重共线性。基于Boruta算法的变量重要性分析证实,在初始的40个候选VP中,有20个对区分乳腺病灶良恶性具有重要价值,包括V2.max、A’V2.max和V1.max。其中,V2.max(定义为基于Voigt模型的病灶周围2毫米边缘内的最大粘度值,单位Pa·s)具有最高的重要性评分,因此被选中与BI-RADS一起构建组合诊断模型(BI-RADS-V)。
预测模型的开发与性能评估:模型性能指标总结显示,BI-RADS-V的AUC显著高于BI-RADS-O(0.96对0.91;DeLong检验,p < 0.001)。此外,BI-RADS-V展现出更高的敏感性(89.8%对80.5%)和特异性(88.7%对82.3%)。NRI(0.282)和IDI(0.179)进一步量化了其显著改善。H-L检验表明两个模型的预测概率与观测概率之间均无显著偏差(p > 0.05)。BI-RADS-V的校准曲线更接近对角线参考线,且获得了更低(更优)的Brier评分(0.076对0.116)。DCA显示,在广泛的阈值概率范围内,BI-RADS-V的净收益曲线始终高于BI-RADS-O,凸显了其更优的临床效用。敏感性分析证实了BI-RADS-V模型的稳健性。在验证队列中,BI-RADS-V表现出最小的性能退化,AUC为0.94,敏感性为91.5%,特异性为83.8%,校准良好且Brier评分为0.102。
亚组性能分析表明,BI-RADS-V在所有预设的患者亚组中均保持较高的诊断效能(AUC > 0.90)。具体而言,在病灶大小亚组中,≤20毫米病灶的AUC为0.93,>20毫米病灶的AUC为0.99,差异具有统计学意义(p = 0.007)。大病灶组的敏感性和特异性也更高。在年龄亚组分析中,≤45岁组的AUC为0.98,>45岁组为0.95,差异无统计学意义(p = 0.356),敏感性和特异性结果也相当。
HER2状态与VPs的关联:单变量分析发现五个VPs在名义水平上(p < 0.05)在HER2阳性和阴性组间存在显著差异,其中四个(V1.max, V2.max, A’V1.max 和 A’V2.max)与HER2阳性状态显著相关。在对40个VPs进行多重比较的Bonferroni校正后(显著性阈值设为p < 0.00125),只有V2.max仍与HER2状态显著相关(p < 0.001),其比值比(OR)为1.75,显示出最强的关联。
观察者内可重复性:对于关键粘度参数V2.max的观察者内可重复性分析显示出极佳的可靠性,绝对一致性的ICC为0.908,表明经验丰富的超声医师对此参数的测量具有高度一致性。
讨论
本研究得出了两个主要结论:首先,将BI-RADS与最优VP(V2.max)相结合,能够增强对乳腺病灶良恶性的鉴别能力,并展现出优异的泛化性。其次,据我们所知,这是首批提示VPs与HER2状态存在相关性并探索其潜在解释的研究之一。
Boruta算法的重要性评分显示,源自Voigt模型的VP排名高于基于SWD模型的VP,在20个被归类为“重要”的参数中,有13个源自Voigt模型。这种差异可能归因于复杂的Voigt模型在表征组织粘度方面优于基于线性拟合的SWD模型。本研究所选的最优参数V2.max与先前Jia等人研究所用的A’V2.max存在差异。这种差异或许可以用恶性乳腺病灶在剪切波弹性成像中的“僵硬环征”来解释。该征象在病理上反映了病灶周围区域因结缔组织增生和肿瘤细胞浸润而改变的力学特性,从而导致剪切波速度升高。相比之下,病灶核心通常表现出较低的剪切波速度,这可能与波衰减增加有关。A’V2.max的性能较差可能是由于其组成性质——整合了病灶和周围组织的粘度特征,其数值可能受到病灶核心低剪切波速度的干扰,最终降低了其相对于更具体的V2.max的诊断效用。此外,本研究的变量筛选策略(Boruta算法)能有效处理复杂的变量交互作用和多重共线性,从而产生了更稳健可靠的变量选择。研究还证实了UVI的技术稳健性,关键参数V2.max具有极佳的观察者内可重复性,这是该定量生物标志物临床转化的关键前提。
将最优VP(V2.max)与BI-RADS整合到逻辑回归模型中产生的BI-RADS-V,其诊断准确性显著高于原始BI-RADS-O。重要的是,BI-RADS-V不仅提高了敏感性,还显著提升了特异性,从而缓解了传统超声在乳腺病灶诊断中特异性低的公认局限。显著的NRI和IDI进一步验证了BI-RADS-V的诊断优势。模型校准评估也证实了BI-RADS-V优于BI-RADS-O,其校准曲线更接近对角线参考线,H-L检验结果更优,Brier评分更低。这些指标共同肯定了BI-RADS-V更高的可靠性。DCA显示,在广泛的临床相关阈值概率范围内,BI-RADS-V始终能带来比BI-RADS-O更大的净收益,凸显了其更优的临床效用。BI-RADS-V在验证队列中也表现出强大的泛化能力,其AUC稳定,敏感性和特异性稳健,校准良好且Brier评分低。BI-RADS-V的优越性能可解释为恶性乳腺病灶因细胞和细胞外基质结构的生物力学变化而导致的粘性特性增加。与BI-RADS-O相比,BI-RADS-V纳入了对粘性特性的额外分析,能够更全面地评估乳腺病灶。此外,VP作为客观定量指标的引入有助于提高诊断的稳定性。
为更全面地评估BI-RADS-V,我们评估了其在不同患者亚组中的诊断性能。尽管在年龄组间未观察到显著的性能差异,但BI-RADS-V在年轻患者队列中获得了更高的AUC。潜在机制可能涉及年轻患者中侵袭性更强的三阴性乳腺癌亚型比例较高。三阴性乳腺癌以高度纤维化的基质微环境为特征,已知这会赋予组织更高的粘度。这种增加的粘度可能与良性病灶的粘度形成更明显的对比,从而有助于UVI的识别。根据病灶大小观察到显著的性能差异,BI-RADS-V对较大病灶表现出更优的诊断准确性。我们推测,这种差异背后的机制是较大病灶中通常存在更晚期的基质重塑和纤维化,这会赋予更大的粘性特性。亚组分析证实了BI-RADS-V在年龄和病灶大小亚组中的高诊断性能,同时突出其在年轻患者和大病灶患者中的最佳性能。这证明了模型的稳健性,更重要的是,表明该模型在这些特定人群和临床背景下尤其具有应用前景。
HER2是乳腺癌的一个重要治疗靶点,其过度表达与肿瘤侵袭性增强和不良预后密切相关。尽管针对HER2的靶向治疗显著改善了患者生存率,但其目前的检测标准方法(IHC和FISH)具有侵入性、成本高且不适用于重复监测。这种固有的局限性凸显了对无创技术评估HER2状态的迫切临床需求。在此背景下,我们的研究提供了初步证据,表明UVI可能提供一种新的解决方案。值得注意的是,我们的分析显示HER2状态与四个Voigt模型衍生的VPs之间存在显著相关性(p < 0.05),其中V2.max显示出最强的关联。这种现象可能与HER2介导的缺氧有关,已知缺氧会促进细胞外基质中胶原蛋白的产生,并可能因此导致粘度升高。重要的是,我们观察到与HER2相关的VPs特别与病灶周围基质的粘度特性相关。Gan等人曾报道,HER2阳性癌症中的基质变化(包括胶原增生)在空间上是异质的,在浸润前沿和肿瘤巢周围最为明显。因此,我们假设UVI有可能通过量化由不均匀结缔组织增生引起的特征性瘤周粘度改变,从而有助于HER2状态的无创评估。
本研究存在一些局限性。首先,其单中心、回顾性设计以及纳入计划进行活检或手术的患者(“疑似恶性”病例)可能会引入选择偏倚,并限制研究结果在真实筛查人群中的普遍性。其次,统计分析是在病灶水平进行的,未考虑少数患有多发病灶患者之间可能的非独立性,这可能影响了结果。第三,关于UVI测量的可重复性,虽然确认了极佳的观察者内可靠性,但未评估不同操作者之间的观察者间可重复性。第四,我们专注于组合模型的价值,未评估VP单独的判别能力。最后,HER2状态的探索性分析虽然是假设生成性的,但未针对多重比较或其他临床病理因素进行调整,并且所观察到的相关性背后的组织学基础尚不清楚。因此,未来需要纳入多样化临床人群和分子亚型的大规模、多中心研究来推动乳腺UVI领域的发展。
总结
总之,在我们的研究中,将UVI与BI-RADS系统相结合与诊断准确性的提高相关,并显示出良好的泛化性。此外,观察到的病灶周围粘性特征与HER2状态之间的关联,提示其作为分子亚型无创指标的潜力。这些发现支持继续研究UVI在乳腺病灶的个性化评估中的应用。