综述:髋关节骨关节炎影像学评分系统

《Journal of Medical Imaging and Interventional Radiology》:Scoring systems for osteoarthritis of the hip in radiology

【字体: 时间:2025年10月19日 来源:Journal of Medical Imaging and Interventional Radiology

编辑推荐:

  本综述系统梳理了髋关节骨关节炎(OA)在不同影像学模式(包括X线、MRI、超声和CT)中的核心评分系统,如KL、Tonnis、Croft、HOAMS、HIMRISS和SHOMRI等。文章聚焦于各系统的(方法论)细节、可靠性及临床应用,为(疾病严重程度)分层、(治疗策略)制定及(研究)提供了重要的标准化工具,并指出了未来向(人工智能)辅助评估发展的趋势。

  

平片X线摄影

髋关节骨关节炎(OA)的X线评估长期以来依赖于旨在标准化疾病定义并促进临床和流行病学研究的半定量分级系统。其中,由Kellgren和Lawrence于1957年提出的KL系统是一项开创性贡献。KL分级根据关节间隙狭窄、骨赘形成、软骨下硬化和骨性畸形等特征,将OA严重程度分为五个类别(从0到4)。
随后的几十年里,为改进髋关节OA的X线表征的努力导致了Tonnis分类法的出现,该分类法于20世纪70年代提出。最初为区分发育不良髋关节而构思,Tonnis量表逐渐演变为对成人髋关节退行性变进行分级的实用工具。它基于五个关键发现——软骨下硬化、关节间隙宽度、股骨头球形度、囊肿大小和骨赘形成(描述为“关节边缘唇样增生”)——然而这些参数均未以定量方式定义,限制了系统的客观性和可重复性。尽管如此,研究表明观察者间一致性存在显著变异性,尤其是在早期OA中,这引发了对其单独使用时可靠性的质疑。然而,Tonnis分级在骨科实践中仍然是一个广受认可且具有历史意义的关键工具。
与此同时,于1990年开发的Croft分类法旨在改进髋关节OA的流行病学定义。它涵盖六个等级,从0到5级。0级代表没有任何骨关节炎变化。1级定义为仅存在骨赘病,而2级则是在关节间隙狭窄是唯一可见异常时分配。3级反映了四个主要特征中任意两个共存:骨赘形成、关节间隙狭窄、软骨下硬化和囊性变。当存在其中三个特征时,髋关节被分类为4级。最后,5级包括4级的所有发现,并伴有股骨头畸形的存在,表明更晚期的结构损伤。
虽然Croft量表的使用不如KL或Tonnis普遍,但它已显示出合理的有效性,并影响了关注疾病患病率和危险因素的流行病学研究。

磁共振成像

HOAMS
髋关节骨关节炎MRI评分系统(HOAMS)由Roemer等人于2011年提出,代表了使用磁共振成像评估髋关节骨关节炎(OA)最全面的半定量框架之一。HOAMS旨在提供全器官评估,通过系统方法整合结构和炎症特征,包括特定的成像序列、解剖学细分和特征特异性评分标准。该系统基于冠状位和矢状位质子密度(PD)加权脂肪抑制序列来评估软骨、骨髓病变(BMLs)和软骨下囊肿,并辅以T1加权序列(非脂肪抑制)用于一般形态学评估,以及在需要时使用对比增强脂肪抑制T1加权序列(冠状位和轴位)专门用于评估滑膜炎。
关节在解剖学上被划分为总共15个子区域用于评估骨髓病变(BMLs)和软骨下囊肿——9个对应股骨头,6个对应髋臼。每个BML或软骨下囊肿在其各自的子区域内使用从0到3的半定量量表进行评分,基于估计的体积受累百分比:0分表示缺失,1分对应于轻度受累(影响子区域小于33%),2分表示中度受累(介于33%和66%之间),3分代表严重受累(超过子区域体积的66%)。
软骨评估在九个关节子区域进行,涵盖冠状位和矢状位成像平面。每个软骨子区域根据该区域存在的最严重病变从0到4分进行评分。0分表示软骨正常,无任何可见缺损。1分对应于局灶性部分厚度软骨缺损,累及小于25%的子区域表面积,而2分表示局灶性全层缺损,同样累及小于25%。3分分配给存在多个部分厚度缺损或单个浅表缺损累及超过25%面积的情况。4分代表广泛的软骨损伤,其特征是多个全层缺损或单个大的全层缺损影响超过25%的子区域。
滑膜炎在四个定义的解剖位置——冠状位的内侧和外侧方面,以及轴位的前方和后方方面——使用对比增强T1加权脂肪抑制MR图像进行评估。滑膜厚度被测量并在每个位置按0-2分量表评分。0分归属于生理性滑膜,厚度小于2毫米。1分表示轻度滑膜炎,滑膜增厚介于2至4毫米之间,而2分对应于中度至重度滑膜炎,其特征是厚度大于4毫米。通过将所有四个位置的分数相加得到的最大总滑膜炎分数为8分。
骨赘仅在股骨侧的五个预定位置进行评估:内侧、外侧、前方、后方以及头颈交界处的中央关节内区域。这些根据其大小和形态按0到4分量表评分。0分表示无骨赘,1分表示可疑或模棱两可的存在,2分对应于明确的小骨赘,3分代表中等大小的骨赘,4分保留给大的、增生性骨赘。
盂唇病变使用非对比和对比增强序列(取决于可用性)在髋臼边缘周围的五个标准化位置进行评估。评分系统范围从0到3:0分表示盂唇正常,无形态或信号改变;1分表示存在盂唇内信号改变;2分代表明确的盂唇撕裂;3分反映部分或完全的盂唇磨损。除了分级,盂唇肥大和盂旁囊肿的存在与否也分别记录。
与髋关节OA评估相关的其他几个特征通过定性或使用专门的分级系统进行评估。例如,关节积液根据在PD加权脂肪抑制MR图像上观察到的关节囊扩张程度从0到2分级。游离体根据其数量从0到3评分,分数越高表示负担越重。股骨头磨损、髋臼发育不良(由中心边缘角<25°定义)、转子滑囊炎、臀肌止点处的插入性肌腱病和股骨颈处的疝凹等结构异常的存在与否也被系统地记录,从而完成了基于MRI的髋关节OA全面评估。
在其初步验证中,Roemer等人证明了良好至优秀的阅读者内可靠性(范围从滑膜炎的0.69到软骨的0.85)和可变的阅读者间一致性,特别是对于盂唇病理或软骨下囊肿等发现值较低。重要的是,尽管kappa值存在一些变异性,大多数特征的总体百分比一致性范围从60%到超过90%,表明具有普遍可接受的再现性水平。HOAMS还显示出良好的结构效度,严重BMLs和滑膜炎等MRI检测到的特征之间存在明确相关性。然而,与临床症状(包括通过髋关节残疾和骨关节炎结果评分(HOOS)测量的疼痛和功能)的相关性在原始研究中未达到统计学显著性。
HIMRISS
髋关节炎症MRI评分系统(HIMRISS)最初是为了满足使用MRI评估髋关节活动性炎症的聚焦、可靠和半定量方法的需求而构思的。它的发展反映了成像优先级从结构到炎症生物标志物的转变,认识到骨髓病变和滑膜炎/积液,而非慢性软骨丢失或骨赘,更可能与临床症状相关,并且重要的是,可通过治疗改变。与HOAMS等试图编录广泛OA特征的综合系统不同,HIMRISS有意将其范围缩小到活动性疾病的特征。从技术角度看,HIMRISS建立在战略性使用液体敏感STIR序列的基础上,该序列通过消除脂肪骨髓的混杂信号,为检测水肿提供了最佳敏感性。匹配的T1加权图像的纳入进一步加强了解剖定位,并有助于区分水肿与囊肿或红骨髓。
关节在解剖学上被划分为100个子区域:65个用于股骨头,35个用于髋臼。滑膜炎和关节积液在同一15个切片上通过测量股骨表面高信号信号的厚度一起评估:<2毫米为0分,2-4毫米为1分,>4毫米为2分,最高30分。总HIMRISS分数范围从0到114,反映了关节内的炎症负荷。软骨、盂唇、骨赘和囊肿不包括在内,因为HIMRISS纯粹专注于炎症。
SHOMRI
虽然先前的基于MRI的评分系统如HIMRISS和HOAMS分别侧重于炎症特征和单个OA成分的详细评估,但SHOMRI系统的开发旨在提供对整个髋关节更全面和结构化的评估。SHOMRI旨在将软骨丢失、骨髓病变、软骨下囊肿、盂唇损伤和滑膜炎的评估整合到一个可重复且区域特定的框架内,使用标准的非对比MRI协议。
SHOMRI的一个基本方面是其系统的关节解剖学细分。髋关节的解剖学细分基于矢状位和冠状位成像平面,能够精确定位病理特征。在这个子区域内,SHOMRI评估八个关键的OA MRI特征。关节软骨丢失按三点量表分级:0为正常软骨,1为部分厚度丢失,2为全层丢失。骨髓水肿在液体敏感图像上评估为软骨下高信号,并根据其最大垂直尺寸从0到3分级:0为缺失,1为≤0.5厘米,2为0.5-1.5厘米,3为大于1.5厘米的病变。软骨下囊肿类似地根据其最大直径从0到2分级:0为缺失,1为≤0.5厘米,2为>0.5厘米。
盂唇在四个解剖区域——前、后、上、前上——使用六点顺序量表进行评估。0分分配给正常形态或变异(如发育不全),1分表示异常信号或磨损,2分表示简单撕裂,3分表示唇软骨分离,4分表示复杂撕裂,5分表示磨损。其他特征通过二分法或短顺序量表评估。积液,被解释为滑膜炎的标志,当股骨颈处的液体厚度超过0.7厘米时被认为存在。最后,圆韧带异常从0(正常)到3(完全撕裂)分级,中间类别用于信号异常或磨损(1)和部分撕裂(2)。
原始研究报告了所有评估特征的高阅读者内和阅读者间可靠性,组内相关系数(ICC) consistently above 0.9。骨髓水肿显示出最强的一致性(阅读者内ICC高达0.98,阅读者间0.94),而盂唇评估的值最低,尽管仍然优秀(0.93和0.91)。Kappa系数范围从阅读者内的0.65到0.79和阅读者间的0.55到0.79,盂旁囊肿观察到较弱的一致性,而关节内游离体和骨髓病变的值较强。一致性百分比在阅读者内从约70%到98%,阅读者间从66%到99%,阅读者内和阅读者间的总体平均值分别为90.5%和86.5%。完成单侧髋关节评分所需时间平均为一位阅读者9分钟,另一位略低于8分钟。

超声检查

Qvistgaard等人提出了一种基于超声的半定量评分系统,用于评估髋关节骨关节炎,旨在标准化关键结构和炎症特征的评估。该系统使用半定量量表评估四个关键特征。骨赘根据其沿股骨颈的范围从缺失到严重进行分级。股骨头根据其形状进行评估,从正常的圆形轮廓到完全失去定义。滑膜轮廓被描述为凹面、平坦或凸面,反映了关节囊扩张的增加。关节积液根据其可见度评分,从缺失到明确存在。
在他们对100名经放射学确认的髋关节OA患者的研究中,他们证明了良好至优秀的阅读者内一致性(ICC 0.69-0.80)和一般至良好的阅读者间一致性(ICC 0.45-0.65),骨性特征与软组织相比具有特别高的可靠性。有趣的是,OA和滑膜炎的总体超声评估与个体评分良好相关,并且还与患者报告的疼痛,尤其是活动期间的疼痛,显示出显著关联。尽管与Kellgren-Lawrence放射学分级相关性较弱,但超声参数显示出独立的预测价值,表明了对疾病活动性和症状负担的补充洞察。总体而言,该评分系统提供了一个可重复的框架,用于评估髋关节OA的结构退变和炎症,即使对于具有中等超声经验的临床医生,只要确保充分的培训,它也可能是一个有价值的工具。

计算机断层扫描

Turmezei等人提出了一种创新的基于CT的系统,用于评估髋关节骨关节炎,旨在通过实现结构特征的详细3D映射来克服常规放射摄影的局限性。为了可视化整个队列的疾病模式,作者通过汇总每个髋关节每个扇区的最严重分数,并将其绘制在近端股骨的程式化2D和3D表示上,开发了“特征严重程度图”。这些地图揭示了疾病特征的一致热点,特别是后下和上外侧骨赘以及后外侧关节间隙狭窄——这些区域在标准前后位X光片上通常代表性不足。
基于这个描述性框架,一项配套研究测试了基于CT的复合分数的可靠性和诊断性能,该分数汇总了骨赘、囊肿和JSW的基于扇区的分数,并将疾病分类为无(0-2)、发展中(3-4)或已确立(5-7)。CT复合分数显示出显著的观察者内和观察者间一致性(加权kappa分别为0.65和0.58),三分类CT等级的可靠性甚至更高(κ=0.74-0.75)。相比之下,基于数字重建放射照片的Kellgren和Lawrence分级显示出较低且更易变的的一致性,尤其是在观察者间评估中(k=0.63)。ROC分析揭示了CT复合分数的强大诊断性能,曲线下面积(AUC)为0.91,进一步支持其作为可靠成像生物标志物的潜力。

讨论

总而言之,由Kellgren-Lawrence(KL)、Tonnis和Croft开发的分类系统构成了放射学骨关节炎(OA)分级的历史支柱。现代基于成像的系统,特别是为MRI和CT开发的系统,经常在结构上或方法上引用这些历史系统,通常将它们用作验证基准。
在这种情况下,由Roemer等人提出的基于MRI的髋关节骨关节炎MRI评分系统(HOAMS)提供了一个区域特定的半定量评估,它避免提供单一的复合分数。相反,它通过在定义的解剖区域分别对每个结构——软骨、骨髓、骨赘等——进行评分,提供了对髋关节的详细评估。
随后的研究扩展了HOAMS的效用和局限性。Guermazi等人在一篇应用于多个关节的半定量MRI评分系统的全面综述中,承认HOAMS是解剖学上最详细的系统之一,同时也指出其比较反应性和临床适用性尚未最终确定。Jaremko等人进一步阐明了HOAMS相对于更聚焦的工具(如髋关节炎症MRI评分系统(HIMRISS))的定位,强调了前者的全器官方法与后者的靶向炎症焦点。值得注意的是,他们证实了HOAMS对于骨髓病变(kappa=0.85)的优秀可靠性和对于软骨损伤(kappa=0.65)的实质性一致性,同时承认PD加权序列的局限性,这些序列可能模糊红骨髓和水肿之间的区别——这个问题由HIMRISS中使用的STIR序列更有效地解决。
Maksymowych等人在一个单独的队列中验证了HOAMS和HIMRISS,强调了阅读者培训的关键作用。他们证明,经过针对性培训后,HOAMS的阅读者间可靠性显著提高,特别是对于BMLs(ICC从0.52增加到0.85)和滑膜炎(从0.46到0.62)。此外,他们的发现与最初的Roemer研究形成对比,因为他们报告了HOAMS衍生的BML和滑膜炎分数与患者报告的疼痛(WOMAC)之间存在显著关联,尤其是在早期OA中。然而,结构特征如软骨和骨赘继续显示出仅中等的可靠性。
HIMRISS则专门开发用于评估髋关节的炎症变化,并已在各种临床环境中得到验证。Jaremko等人将HIMRISS应用于一项涉及接受关节内皮质类固醇注射患者的纵向研究。该系统在基线BML评分方面表现出优秀的可靠性(ICC 0.83-0.92),并且在检测变化方面表现出良好至中等的可靠性,特别是在股骨头(ICC 0.76-0.81),尽管在髋臼较低(ICC 0.42-0.56),可能由于该区域复杂的解剖结构和可变的骨髓组成。值得注意的是,大多数病理负荷在HIMRISS协议的中心五个切片中被捕获,这提出了在不显著影响诊断的情况下简化工作流程的可能性。
除了可靠性,HIMRISS作为预后生物标志物已显示出有前景的临床有效性。在一项由Deseyne等人进行的前瞻性研究中,该系统被用于预测对透明质酸注射的反应。基线HIMRISS分数,特别是高的股骨BML分数,与治疗反应呈负相关。总HIMRISS分数低于15的患者显著更可能实现临床意义的改善(WOMAC50),具有高特异性(97%)和阳性预测值91%。这些结果支持HIMRISS不仅在监测疾病活动性方面,而且在指导治疗决策方面的作用,特别是在早期或活动性炎症疾病中。
最近的发展试图将人工智能整合到基于HIMRISS的工作流程中以提高可扩展性。Zheng等人开发了一种基于U-Net架构的深度学习分割模型,用于自动检测和量化BMLs和滑膜炎。尽管最初在炎症性关节病中测试,该模型显示出有希望的结果,解剖结构的分割准确度为88.5%,病变约为69%。模型衍生的分数与专家HIMRISS评级和炎症标志物(如ESR和CRP)强烈相关,展示了在临床实践中AI驱动炎症评估标准化和减少阅读者负担的潜力。
至于SHOMRI,其有效性已通过多条证据得到证实。SHOMRI已显示出与关节镜检查结果的高度一致性,特别是在股骨髋臼撞击(FAI)中的软骨盂唇病理。它与放射学分类(例如,KL和Tonnis等级)以及患者报告的结果(如HOOS和HAGOS)显著相关。然而,MRI特征与临床症状之间的关系仍然复杂且通常是非线性的,尤其是在早期OA或运动员中。例如,高的SHOMRI分数——特别是在盂唇评估中——与高冲击力运动员的髋部疼痛相关,尽管结构异常的患病率在症状性和无症状个体之间没有显著差异。
SHOMRI临床价值的额外支持来自其与生物力学变化的关联,包括改变的负荷模式和楼梯行走期间关节运动学的偏差。拓扑数据分析(TDA)进一步表明,SHOMRI盂唇分数与放射学严重程度和疼痛轨迹一致,提示在疾病表型分析中的作用。此外,SHOMRI分数已与特定的骨形状特征及其纵向演变相关联,突出了该系统捕获与OA进展相关的形态类型的能力。
纵向研究证实了SHOMRI对疾病进展的敏感性:超过70%的髋关节在两年内显示出影像学变化,与对照组相比,OA中软骨下囊肿的进展特别高。基线BMEP可预测症状和生活质量的恶化。在FAI患者中,与物理治疗相比,关节镜检查在38个月时显示出显著较少的SHOMRI进展,提示潜在的疾病修饰效应。报告SHOMRI变化的标准化定义允许动态特征(如BMLs和囊肿)的恶化和改善,尽管软骨、盂唇和韧带分数通常在没有手术干预的情况下不会改善。
尽管有这些优势,SHOMRI存在某些局限性。评分过程耗时,不适合常规临床工作流程。对细微OA特征的敏感性可能欠佳,并且积液/滑膜炎的二元分类(存在/缺失)可能无法捕捉纵向变化。MRI发现与症状之间的复杂关系也使预后解释复杂化,并且某些研究中的小样本量可能限制普适性。
超声(US)已被证明是髋关节骨关节炎(OA)的一种有价值的成像工具,通过可视化骨性和软组织来补充常规放射摄影(X线)。基础的Qvistgaard等人评分系统引入了一种用于评估关键特征(如骨赘、股骨头形态和积液)的半定量方法。
关于其可靠性的研究表明,对于髋关节积液/滑膜炎和整体OA分级,观察者间一致性为实质性到几乎完美,并且也报告了良好至优秀的观察者内一致性。然而,用于髋关节滑膜炎的能量多普勒显示可靠性差,可能是由于关节位置深,限制了多普勒对低血流的敏感性。
与X线相比,US对于检测结构变化(如骨赘和股骨头畸形)被认为相当甚至更优。虽然US和X线在整体OA分级方面存在中度一致性,但两种模式可能识别不同的结构病变。
与患者症状(疼痛)的相关性较不一致。Qvistgaard等人最初发现US分数(尤其是整体OA和骨赘)与报告的疼痛之间存在显著关联。然而,最近的研究,特别是在晚期OA中,发现US发现与患者报告的疼痛或功能评分之间没有显著关联。
总之,US已发展成为髋关节OA形态学评估的可靠工具,对于某些结构变化提供了与X线相当或更优的洞察,尽管其与疼痛的直接联系仍然可变。
在用于评估髋关节骨关节炎的基于CT的方法中,最有影响力的贡献仍然是Turmezei等人提出的半定量分级系统,该系统系统评估骨赘、软骨下囊肿、硬化、关节间隙狭窄和股骨头畸形,证明了显著的观察者间可靠性。虽然后续研究扩展了这一框架——例如对3D CT重建中皮质骨厚度的分析、开发用于OA自动检测的深度学习算法,以及小梁骨微观结构与疼痛严重程度或疾病阶段的相关性——但这些调查并不构成正式的、经过验证的评分系统。相反,它们代表了新兴的方法,尽管有希望,但很大程度上仍是探索性的。这些发现有可能为未来旨在改进或开发定量基于CT的OA评估工具的努力奠定基础,但这仍有待证实。

结论

总之,虽然传统的放射学评分在日常临床评估中仍然有价值,但基于MRI的系统(如SHOMRI、HOAMS和HIMRISS)提供了对髋关节骨关节炎特征的更详细评估。然而,这些工具通常耗时且需要大量专业知识,这限制了它们在日常实践中的适用性。因此,它们的使用目前仅限于选定的病例或研究环境,而非广泛的临床实施。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号