真实世界全球地理区域监测中SVR后HCC预测风险模型的验证

《LIVER INTERNATIONAL》:Validation of Risk Models for Predicting Post-SVR HCC in Real-World Surveillance Across Global Geographic Regions

【字体: 时间:2026年06月10日 来源:LIVER INTERNATIONAL 5.2

编辑推荐:

  背景与目的 多种临床风险模型已被提出,用于对慢性丙型肝炎病毒(HCV)感染患者在获得持续病毒学应答(SVR)后的肝细胞癌(HCC)风险进行分层。然而,既往验证工作主要集中于单中心或特定国家队列,临床风险模型能否广泛适用于全球人群仍不明确。研究人员对SVR后患

  
背景与目的

多种临床风险模型已被提出,用于对慢性丙型肝炎病毒(HCV)感染患者在获得持续病毒学应答(SVR)后的肝细胞癌(HCC)风险进行分层。然而,既往验证工作主要集中于单中心或特定国家队列,临床风险模型能否广泛适用于全球人群仍不明确。研究人员对SVR后患者HCC风险分层模型在不同区域中的性能差异进行了表征。

方法

研究人员在6个真实世界队列中分析了4种HCC临床风险模型,即aMAP评分、FIB-4指数、GES评分和Toronto HCC风险指数(THRI)。队列共纳入8796例来自全球不同地理区域的SVR后患者。模型判别力采用Harrell一致性统计量(c-statistic)评估。研究人员比较了各模型低风险、中风险和高风险分组之间的HCC发病率。

结果

患者特征分布及HCC发病率在不同地理区域间存在差异。尽管各区域中c-statistic最高的模型并不相同,但在每个队列内部,各模型的预测性能总体相近。整体来看,各模型的性能均低于原始报告中的结果;多数区域中模型的c-statistic仍低于0.70。

结论

针对SVR后患者进行HCC风险分层的临床模型,在判别力和校准度方面仍需持续改进。模型准确性可能因地理区域而异,这凸显了开展外部验证以评估模型可迁移性的重要性,同时提示不存在可被普遍适用的单一模型。
该研究发表于《LIVER INTERNATIONAL》,聚焦于丙型肝炎病毒(HCV)清除后持续病毒学应答(SVR)人群肝细胞癌(HCC)风险预测模型在全球真实世界中的可推广性问题。研究背景在于,直接抗病毒药物(DAA)显著提高了HCV治愈率,但即使达到SVR,尤其是肝硬化患者,HCC风险仍持续存在,因此SVR后监测仍是临床管理的重要组成部分。现有多种HCC风险分层模型已被提出,且在各自开发地区表现良好,但这些模型多源于单中心或特定国家数据,缺乏跨区域、跨人群的系统性外部验证。与此同时,不同地区在患者年龄、性别、HCV基因型、肝硬化比例以及SVR后监测策略方面均存在明显差异,可能影响模型的判别性能与临床适用性。因此,开展全球多区域真实世界验证,对于判断这些模型是否具备可迁移性(transportability)及是否需要区域特异性模型,具有直接临床意义。

研究人员依托国际合作网络,整合来自欧洲、北美、南美、中东、南亚与东南亚、东亚6个地区、30家高容量学术中心的真实世界队列,对4种采用常规临床变量构建的HCC风险模型进行验证与比较,包括aMAP评分、FIB-4指数、GES评分和Toronto HCC风险指数(THRI)。研究纳入8796例经DAA治疗后达到SVR的患者,排除了既往HCC患者以及DAA治疗前已有HCC或可疑肝结节者。结果显示,不同地区患者构成与HCC发生情况差异显著,各模型在不同区域中的最佳表现并不一致,且总体判别力低于原始开发报告,多数模型在多数地区的Harrell一致性指数(c-index)低于0.70。研究据此得出结论:现有SVR后HCC风险模型在全球真实世界中的判别力和校准度均仍有限,尚无单一模型可普遍适用于所有地区,临床应用前必须进行严格外部验证,并需进一步开发更具普适性或区域适配性的模型。

研究方法方面,研究人员纳入6个全球真实世界队列的SVR后患者,收集DAA治疗前基线人口学与实验室数据,以及随访期间HCC发生结局;按预设阈值将患者分别纳入aMAP、FIB-4、GES和THRI的低、中、高风险组。采用Kaplan–Meier法评估各组HCC累积发生率,以log-rank检验比较差异;以Harrell c-index评价模型判别力,并结合Brier评分、校准曲线评估校准度,进一步通过决策曲线分析(DCA)评估临床净获益。另进行了肝硬化亚组及排除晚期HCC病例的敏感性分析。样本来源包括欧洲、美国、阿根廷、巴西、埃及、印度、泰国、日本和中国台湾地区。

在研究结果部分,论文首先报告了不同地区研究对象的基线特征差异。

3.1 Characteristics of Study Patients by Regions
研究人员按地区比较了患者背景特征,发现年龄、性别、HCV基因型及肝硬化比例均存在显著区域差异。东亚患者SVR时中位年龄最高,为70岁,南亚与东南亚最低,为52岁;欧洲、北美及南亚与东南亚以男性为主,而南美与东亚以女性为主。HCV基因型分布亦高度区域化:欧洲、北美、南美及东亚以1型为主,南亚与东南亚以3型为主,中东则全部为4型。肝硬化比例除南美较低、南亚与东南亚较高外,其余地区多在50%–65%之间。该结果说明,模型应用所面对的基础风险人群并不均质,为后续模型性能差异提供了解释基础。

3.2 HCC Incidence After SVR, Stratified by Region
研究人员比较了不同地区SVR后HCC发生情况,显示区域间累积发病率及肿瘤负荷存在差异。各队列中位随访时间约21.9–42.7个月。SVR后前3年,南亚与东南亚HCC发病率最高;但延长至5年后,各队列累计发生率趋于接近,仅欧洲相对较低。不同地区HCC诊断时最大肿瘤直径差异明显,东亚最小,为1.8 cm,南亚与东南亚最大,为4.0 cm;早期HCC比例在东亚最高,在欧洲较低。该部分结果提示,不同地区不仅HCC发生风险不同,监测强度及发现时机也可能不同。

3.3 Performance of HCC Risk Stratification Models After SVR by Regions
研究人员系统比较了4种模型在各地区的风险分组分布、HCC发生率及判别力。首先,各模型对同一地区患者的风险分类差异很大,例如aMAP在各队列中划为低风险者通常不足20%,而GES在多数队列中将超过半数患者归入低风险;相反,aMAP和FIB-4常将超过三分之一患者划为高风险,而THRI划为高风险者通常不足15%。其次,多数模型表现出由低风险到高风险组HCC发生率递增的趋势,但并非在所有地区均稳定成立。例如,GES在北美和南美队列中未能较好区分不同风险组;aMAP中风险组在北美和南美更接近高风险组,而在中东及南亚与东南亚则更接近低风险组。值得注意的是,aMAP低风险组在全部队列中仅有1例患者发生HCC,且该病例来自南亚与东南亚。再次,就Harrell c-index而言,各模型在不同地区大致介于0.5–0.8之间,但多数地区均低于0.70,提示判别力整体有限。各地区表现最优的模型并不相同:欧洲和中东为aMAP,北美为THRI,南美、南亚与东南亚及东亚为GES,但同一区域内模型间差异多数未达到统计学显著。该部分结果表明,现有模型虽可在一定程度上进行风险分层,但无法在全球范围内稳定识别高风险患者,且不存在普适最优模型。

3.4 Sensitivity Analyses
研究人员进一步在肝硬化患者中进行敏感性分析,并排除诊断时已属晚期的SVR后HCC病例。结果显示,即使限制于肝硬化患者,各模型在同一区域内仍表现相近,且多数c-index依旧低于0.70。排除晚期HCC后,结果总体与主分析一致,仅c-index轻度升高。该结果说明,区域差异并不能仅由不同地区监测失败或纳入非肝硬化患者所解释。

3.5 Calibration and Overall Prediction Accuracy
除判别力外,研究人员还评估了模型整体预测准确性与校准度。Brier评分显示,不同区域中表现最佳的模型并不相同;校准曲线提示,各模型预测风险与观察风险总体具有可接受一致性,但校准程度会随地区及风险区间而变化。该结果进一步说明,即使某一模型在某地区判别力尚可,其预测概率与真实风险之间也未必达到理想匹配。

3.6 Clinical Utility Assessed by Decision Curve Analysis
研究人员采用决策曲线分析评估模型的临床应用价值。总体上,4种模型在临床相关阈值概率范围内均较“全部监测”或“全部不监测”策略具有更高净临床获益。在较低阈值概率下,各模型净获益相近;在较高阈值下,GES在总体队列中净获益最大。但区域分层分析显示,各模型临床效用存在明显异质性。该结果表明,风险分层监测在许多地区可能提高效率,但统一的全球应用策略并不理想。

讨论部分强调,本研究以全球多区域真实世界数据证明,SVR后HCC风险模型的外部可迁移性有限。模型性能差异部分来自患者年龄、HCV基因型、肝硬化比例等基础特征差异,也与各地区SVR后监测指南、监测强度、依从性及诊断阈值不同有关。但敏感性分析提示,区域间性能差异并非仅由监测策略差异所致。更重要的是,即便在真实世界整体层面,4种模型的判别力也普遍欠佳,反映出仅依赖常规临床变量预测SVR后HCC风险的局限性。论文指出,部分模型建立于高度区域化人群,例如GES主要基于埃及HCV 4型SVR患者开发,这可能限制模型在异质人群中的泛化能力。研究人员还指出,若纳入肝脏硬度(liver stiffness)或血液生物标志物等更精细变量,未来模型性能可能得到提升。文章同时提到,aMAP低风险组在各地区几乎不发生HCC,提示该模型可能有助于识别极低风险人群,但仍需前瞻性研究进一步验证其用于优化监测策略的可行性。

研究结论可译为:研究结果强调,在真实世界临床实践中,将风险分层模型应用于SVR后HCC监测存在明显困难。用于预测HCC发生的风险分层模型性能总体欠佳,且“最优模型”因地区而异。未来研究应着重提高风险分层模型的诊断性能,并增强其在广泛国际人群中的普适性。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号