真实世界全球地理区域监测中SVR后HCC预测风险模型的验证

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《LIVER INTERNATIONAL》：Validation of Risk Models for Predicting Post-SVR HCC in Real-World Surveillance Across Global Geographic Regions

【字体：大中小】 时间：2026年06月10日 来源：LIVER INTERNATIONAL 5.2

编辑推荐：

　　背景与目的多种临床风险模型已被提出，用于对慢性丙型肝炎病毒（HCV）感染患者在获得持续病毒学应答（SVR）后的肝细胞癌（HCC）风险进行分层。然而，既往验证工作主要集中于单中心或特定国家队列，临床风险模型能否广泛适用于全球人群仍不明确。研究人员对SVR后患

背景与目的

多种临床风险模型已被提出，用于对慢性丙型肝炎病毒（HCV）感染患者在获得持续病毒学应答（SVR）后的肝细胞癌（HCC）风险进行分层。然而，既往验证工作主要集中于单中心或特定国家队列，临床风险模型能否广泛适用于全球人群仍不明确。研究人员对SVR后患者HCC风险分层模型在不同区域中的性能差异进行了表征。

方法

研究人员在6个真实世界队列中分析了4种HCC临床风险模型，即aMAP评分、FIB-4指数、GES评分和Toronto HCC风险指数（THRI）。队列共纳入8796例来自全球不同地理区域的SVR后患者。模型判别力采用Harrell一致性统计量（c-statistic）评估。研究人员比较了各模型低风险、中风险和高风险分组之间的HCC发病率。

结果

患者特征分布及HCC发病率在不同地理区域间存在差异。尽管各区域中c-statistic最高的模型并不相同，但在每个队列内部，各模型的预测性能总体相近。整体来看，各模型的性能均低于原始报告中的结果；多数区域中模型的c-statistic仍低于0.70。

结论

针对SVR后患者进行HCC风险分层的临床模型，在判别力和校准度方面仍需持续改进。模型准确性可能因地理区域而异，这凸显了开展外部验证以评估模型可迁移性的重要性，同时提示不存在可被普遍适用的单一模型。

该研究发表于《LIVER INTERNATIONAL》，聚焦于丙型肝炎病毒（HCV）清除后持续病毒学应答（SVR）人群肝细胞癌（HCC）风险预测模型在全球真实世界中的可推广性问题。研究背景在于，直接抗病毒药物（DAA）显著提高了HCV治愈率，但即使达到SVR，尤其是肝硬化患者，HCC风险仍持续存在，因此SVR后监测仍是临床管理的重要组成部分。现有多种HCC风险分层模型已被提出，且在各自开发地区表现良好，但这些模型多源于单中心或特定国家数据，缺乏跨区域、跨人群的系统性外部验证。与此同时，不同地区在患者年龄、性别、HCV基因型、肝硬化比例以及SVR后监测策略方面均存在明显差异，可能影响模型的判别性能与临床适用性。因此，开展全球多区域真实世界验证，对于判断这些模型是否具备可迁移性（transportability）及是否需要区域特异性模型，具有直接临床意义。

研究人员依托国际合作网络，整合来自欧洲、北美、南美、中东、南亚与东南亚、东亚6个地区、30家高容量学术中心的真实世界队列，对4种采用常规临床变量构建的HCC风险模型进行验证与比较，包括aMAP评分、FIB-4指数、GES评分和Toronto HCC风险指数（THRI）。研究纳入8796例经DAA治疗后达到SVR的患者，排除了既往HCC患者以及DAA治疗前已有HCC或可疑肝结节者。结果显示，不同地区患者构成与HCC发生情况差异显著，各模型在不同区域中的最佳表现并不一致，且总体判别力低于原始开发报告，多数模型在多数地区的Harrell一致性指数（c-index）低于0.70。研究据此得出结论：现有SVR后HCC风险模型在全球真实世界中的判别力和校准度均仍有限，尚无单一模型可普遍适用于所有地区，临床应用前必须进行严格外部验证，并需进一步开发更具普适性或区域适配性的模型。

研究方法方面，研究人员纳入6个全球真实世界队列的SVR后患者，收集DAA治疗前基线人口学与实验室数据，以及随访期间HCC发生结局；按预设阈值将患者分别纳入aMAP、FIB-4、GES和THRI的低、中、高风险组。采用Kaplan–Meier法评估各组HCC累积发生率，以log-rank检验比较差异；以Harrell c-index评价模型判别力，并结合Brier评分、校准曲线评估校准度，进一步通过决策曲线分析（DCA）评估临床净获益。另进行了肝硬化亚组及排除晚期HCC病例的敏感性分析。样本来源包括欧洲、美国、阿根廷、巴西、埃及、印度、泰国、日本和中国台湾地区。

在研究结果部分，论文首先报告了不同地区研究对象的基线特征差异。

3.1 Characteristics of Study Patients by Regions
研究人员按地区比较了患者背景特征，发现年龄、性别、HCV基因型及肝硬化比例均存在显著区域差异。东亚患者SVR时中位年龄最高，为70岁，南亚与东南亚最低，为52岁；欧洲、北美及南亚与东南亚以男性为主，而南美与东亚以女性为主。HCV基因型分布亦高度区域化：欧洲、北美、南美及东亚以1型为主，南亚与东南亚以3型为主，中东则全部为4型。肝硬化比例除南美较低、南亚与东南亚较高外，其余地区多在50%–65%之间。该结果说明，模型应用所面对的基础风险人群并不均质，为后续模型性能差异提供了解释基础。

3.2 HCC Incidence After SVR, Stratified by Region
研究人员比较了不同地区SVR后HCC发生情况，显示区域间累积发病率及肿瘤负荷存在差异。各队列中位随访时间约21.9–42.7个月。SVR后前3年，南亚与东南亚HCC发病率最高；但延长至5年后，各队列累计发生率趋于接近，仅欧洲相对较低。不同地区HCC诊断时最大肿瘤直径差异明显，东亚最小，为1.8 cm，南亚与东南亚最大，为4.0 cm；早期HCC比例在东亚最高，在欧洲较低。该部分结果提示，不同地区不仅HCC发生风险不同，监测强度及发现时机也可能不同。

3.3 Performance of HCC Risk Stratification Models After SVR by Regions
研究人员系统比较了4种模型在各地区的风险分组分布、HCC发生率及判别力。首先，各模型对同一地区患者的风险分类差异很大，例如aMAP在各队列中划为低风险者通常不足20%，而GES在多数队列中将超过半数患者归入低风险；相反，aMAP和FIB-4常将超过三分之一患者划为高风险，而THRI划为高风险者通常不足15%。其次，多数模型表现出由低风险到高风险组HCC发生率递增的趋势，但并非在所有地区均稳定成立。例如，GES在北美和南美队列中未能较好区分不同风险组；aMAP中风险组在北美和南美更接近高风险组，而在中东及南亚与东南亚则更接近低风险组。值得注意的是，aMAP低风险组在全部队列中仅有1例患者发生HCC，且该病例来自南亚与东南亚。再次，就Harrell c-index而言，各模型在不同地区大致介于0.5–0.8之间，但多数地区均低于0.70，提示判别力整体有限。各地区表现最优的模型并不相同：欧洲和中东为aMAP，北美为THRI，南美、南亚与东南亚及东亚为GES，但同一区域内模型间差异多数未达到统计学显著。该部分结果表明，现有模型虽可在一定程度上进行风险分层，但无法在全球范围内稳定识别高风险患者，且不存在普适最优模型。

3.4 Sensitivity Analyses
研究人员进一步在肝硬化患者中进行敏感性分析，并排除诊断时已属晚期的SVR后HCC病例。结果显示，即使限制于肝硬化患者，各模型在同一区域内仍表现相近，且多数c-index依旧低于0.70。排除晚期HCC后，结果总体与主分析一致，仅c-index轻度升高。该结果说明，区域差异并不能仅由不同地区监测失败或纳入非肝硬化患者所解释。

3.5 Calibration and Overall Prediction Accuracy
除判别力外，研究人员还评估了模型整体预测准确性与校准度。Brier评分显示，不同区域中表现最佳的模型并不相同；校准曲线提示，各模型预测风险与观察风险总体具有可接受一致性，但校准程度会随地区及风险区间而变化。该结果进一步说明，即使某一模型在某地区判别力尚可，其预测概率与真实风险之间也未必达到理想匹配。

3.6 Clinical Utility Assessed by Decision Curve Analysis
研究人员采用决策曲线分析评估模型的临床应用价值。总体上，4种模型在临床相关阈值概率范围内均较“全部监测”或“全部不监测”策略具有更高净临床获益。在较低阈值概率下，各模型净获益相近；在较高阈值下，GES在总体队列中净获益最大。但区域分层分析显示，各模型临床效用存在明显异质性。该结果表明，风险分层监测在许多地区可能提高效率，但统一的全球应用策略并不理想。

讨论部分强调，本研究以全球多区域真实世界数据证明，SVR后HCC风险模型的外部可迁移性有限。模型性能差异部分来自患者年龄、HCV基因型、肝硬化比例等基础特征差异，也与各地区SVR后监测指南、监测强度、依从性及诊断阈值不同有关。但敏感性分析提示，区域间性能差异并非仅由监测策略差异所致。更重要的是，即便在真实世界整体层面，4种模型的判别力也普遍欠佳，反映出仅依赖常规临床变量预测SVR后HCC风险的局限性。论文指出，部分模型建立于高度区域化人群，例如GES主要基于埃及HCV 4型SVR患者开发，这可能限制模型在异质人群中的泛化能力。研究人员还指出，若纳入肝脏硬度（liver stiffness）或血液生物标志物等更精细变量，未来模型性能可能得到提升。文章同时提到，aMAP低风险组在各地区几乎不发生HCC，提示该模型可能有助于识别极低风险人群，但仍需前瞻性研究进一步验证其用于优化监测策略的可行性。

研究结论可译为：研究结果强调，在真实世界临床实践中，将风险分层模型应用于SVR后HCC监测存在明显困难。用于预测HCC发生的风险分层模型性能总体欠佳，且“最优模型”因地区而异。未来研究应着重提高风险分层模型的诊断性能，并增强其在广泛国际人群中的普适性。

联系信箱：

粤ICP备09063491号

热点排行