《Annals of Nuclear Medicine》:Comparison of automated bone scan indexes in patients with prostate cancer: aBSI and BONENAVI
编辑推荐:
骨扫描指数(bone scan index, BSI)在日本、欧洲和美国广泛应用。BONENAVI(日本)和aBSI(欧洲和美国)软件程序基于不同的训练和验证数据集开发,用于计算BSI。然而,它们是否兼容尚未系统确定。研究人员比较了这些程序在患者队列中生成的B
骨扫描指数(bone scan index, BSI)在日本、欧洲和美国广泛应用。BONENAVI(日本)和aBSI(欧洲和美国)软件程序基于不同的训练和验证数据集开发,用于计算BSI。然而,它们是否兼容尚未系统确定。研究人员比较了这些程序在患者队列中生成的BSI,以阐明它们之间的相关性。方法:研究人员回顾性分析了34例前列腺癌患者(平均年龄69.9±9.1 [48–89]岁)的339个闪烁显像数据,这些患者接受了全身骨闪烁显像以评估转移性骨病。对使用99mTc-亚甲基二膦酸盐(MDP)的前位和后位全身扫描进行处理,然后由aBSI和BONENAVI计算BSI。使用Pearson相关系数和Bland-Altman分析评估aBSI和BONENAVI之间的系统差异。研究人员还将随访期间的BSI分类为减少、不变或增加,并评估纵向变化的一致性。结果:每位患者的平均骨扫描次数为10.0±6.8(1-26),使用305对随访研究评估BSI的纵向变化。aBSI和BONENAVI的自动BSI分别为3.23%±3.47%和2.91%±2.84%。两者强相关(r=0.947, p<0.001)。Bland-Altman图显示aBSI倾向于产生略高的BSI(平均差异+0.31%,95%置信区间[CI] 0.19-0.44, p<0.001)。BSI>7%的亚组分析显示aBSI的自动BSI高于BONENAVI(平均差异+1.57%,95% CI 0.99-2.15, p<0.001)。随访期间BSI纵向变化的比率基本一致(78.7% vs 76.4%,分别使用±0.5%和±0.3%阈值,κ=0.63,Cramer's V=0.65,两者p<0.0001)。结论:由软件程序计算的aBSI和BONENAVI BSI强相关,且随访研究中的纵向变化普遍一致。然而,与BONENAVI相比,aBSI的BSI在疾病负荷增加的患者中往往更高。临床医生和研究者在使用或比较不同软件程序的结果时应意识到这些差异。
**研究背景与问题**
骨扫描指数(bone scan index, BSI)是一种定量成像生物标志物,以占全身骨骼质量的百分比(%)表达转移性肿瘤在骨骼中的扩散程度。该概念于1998年提出,早期依赖人工或半自动解读,限制了临床应用。随着基于人工智能(AI)或人工神经网络(ANN)的自动化软件发展,aBSI(EXINI Diagnostics AB, Lund, Sweden)和BONENAVI(PDRadiopharma Co., Ltd., Tokyo, Japan)分别基于欧洲和日本患者数据集训练开发。aBSI在欧洲和北美广泛应用,BONENAVI则针对日本人群优化。尽管两者共享基础概念(热点检测、骨骼分割和自动BSI计算),但训练数据集、图像处理策略和神经网络模型架构不同,可能导致BSI输出存在系统性差异,尤其在转移负荷较高时。然而,两者是否兼容尚未系统确定。本研究旨在明确这些差异,为跨平台结果解读提供依据。论文发表在《Annals of Nuclear Medicine》。
**主要研究方法**
研究人员回顾性分析了金泽大学医院泌尿科34例前列腺癌骨转移患者的339次骨闪烁显像数据(平均年龄69.9±9.1岁)。通过标准临床方案注射
99mTc-亚甲基二膦酸盐(MDP),采集前位和后位全身图像,分别使用aBSI v.3.7.0和BONENAVI v.2.2自动计算BSI。采用Pearson相关系数和Bland-Altman分析评估系统差异;将随访期间BSI变化分为减少、不变或增加,使用κ系数和Cramer's V评估纵向变化一致性。
**研究结果**
**自动化BSI分析**:aBSI和BONENAVI的自动BSI分别为3.23%±3.47%和2.91%±2.84%,两者强相关(R2=0.897, p<0.001)。Bland-Altman分析显示aBSI倾向于产生略高BSI(平均差异+0.31%, 95% CI 0.19-0.44, p<0.001),差异随BSI升高而增大。
**高BSI亚组**:在BSI
BONENAVI>7%的43次检查中,相关性降低(R2=0.180, p=0.002)。aBSI的自动BSI显著高于BONENAVI(平均差异+1.57%, 95% CI 0.99-2.15, p<0.001),个体差异可达4%-5%,表明在高转移负荷时算法差异突出。
**aBSI与BONENAVI的最佳拟合模型**:散点图显示非线性关系。低BSI(<5%)时线性模型(BSI
aBSI=0.0303+1.035×BSI
BONENAVI)拟合良好;高BSI时结合线性与指数模型(BSI
aBSI=0.941×BSI
BONENAVI+Exp[0.0266×BSI
BONENAVI])更优,反映了两软件在高负荷时的系统性偏离。
**BSI变化**:305对随访研究显示,ΔBSI
aBSI与ΔBSI
BONENAVI显著相关(R2=0.612, p<0.0001)。以±0.5%为阈值时,分类一致性为78.7%(κ=0.63, Cramer's V=0.65, p<0.0001);以±0.3%为阈值时,一致性为76.4%(κ=0.63, Cramer's V=0.65, p<0.0001),表明纵向变化趋势基本一致。
**总结讨论与结论**
讨论指出,aBSI与BONENAVI在高BSI时的差异可能源于训练数据集、算法架构(aBSI采用两水平顺序ANN,BONENAVI为单水平集成ANN)及后续优化(aBSI通过模拟图像提高线性响应)。区域热点检测差异(aBSI在上肢、股骨区域较高,BONENAVI在脊柱、胸骨、骨盆较高)可能部分解释不一致。研究局限性包括单中心、样本有限及未进行预后分析。结论:两种软件计算的BSI在多数条件下强相关,纵向变化分类一致;但高转移负荷患者中aBSI的BSI趋向更高,临床和研究应用中应谨慎解释,尤其在多中心或国际比较中。