编辑推荐:
克罗恩病(CD)治疗选择众多但缺乏直接对比。本文通过网状 Meta 分析,对比古塞库单抗(Guselkumab)与其他先进疗法治疗中重度活动性 CD 的疗效。结果显示,Guselkumab 在多项指标上更具优势,或为优选治疗方案,为临床决策提供参考。
引言
克罗恩病(Crohn’s disease,CD)是一种慢性炎症性肠病,其特征为胃肠道全层炎症,可累及从口腔到肛门的整个消化道。患者常出现腹泻、腹痛、直肠出血和疲劳等症状,长期的慢性炎症还可能引发诸如肠狭窄、瘘管和脓肿等严重并发症。在北美、北欧和西欧以及澳大利亚,CD 的患病率和发病率普遍较高,美国目前 CD 的患病率估计为每 10 万人中有 165 人患病。
CD 的治疗颇具挑战,病情较重或对传统疗法无效的患者通常会接受先进疗法来诱导缓解或预防复发。目前有多种产品可供使用或处于研发阶段,它们具有不同的抗炎作用机制 ,包括肿瘤坏死因子抑制(如英夫利昔单抗(infliximab)和阿达木单抗(adalimumab))、白细胞介素(IL)-12/23 抑制(如乌司奴单抗(ustekinumab))、IL-23 抑制(如瑞莎珠单抗(risankizumab)、米立珠单抗(mirikizumab)和古塞库单抗(guselkumab))、整合素阻断(维得利珠单抗(vedolizumab))和 Janus 激酶抑制(乌帕替尼(upadacitinib))。然而,尽管有这些先进疗法,许多患者仍无法实现充分的长期疾病控制。
古塞库单抗是一种 IL-23p19 亚基抑制剂,可在细胞产生源处中和 IL-23,而 IL-23 是 CD 发病机制的关键驱动因素。目前,古塞库单抗已在美国和欧洲获批用于治疗银屑病和银屑病关节炎,在美国还获批用于治疗溃疡性结肠炎。此外,基于 GALAXI 项目的结果,古塞库单抗治疗中重度活动性 CD 正在接受监管审查。两项双盲的 GALAXI 3 期研究独立证实了古塞库单抗与安慰剂相比,在成年中重度活动性 CD 患者中的短期和长期疗效。同时,在第 48 周的预设和多重性控制分析中,汇总数据显示古塞库单抗在关键内镜和综合结局方面优于乌司奴单抗,且两项研究结果相对一致。古塞库单抗的两种皮下维持剂量(每 4 周 200mg(Q4W)和每 8 周 100mg(Q8W))均有效,且安全性良好,与已获批适应症中的情况一致。尽管在双盲的 GALAXI 试验中,古塞库单抗已与安慰剂和乌司奴单抗进行了直接比较,但尚未与其他用于 CD 治疗的先进疗法进行直接对比。
本网状 Meta 分析(network meta-analysis,NMA)的目的是基于临床缓解、临床应答、内镜缓解以及临床缓解与内镜缓解的复合结局,评估古塞库单抗与所有可用疗法在约 1 年(即临床试验中维持治疗的典型随访期)的相对疗效。
方法
2023 年 9 月 19 日,系统文献回顾(systematic literature review,SLR)方案在 PROSPERO 注册(注册号 CRD42023459494)。该方法遵循《Cochrane 干预系统评价手册》的指导,并依据系统评价和 Meta 分析的首选报告项目(PRISMA)声明进行报告。同时,事先制定了 NMA 方案。本分析和总结基于先前已完成 / 发表的试验,作者未进行任何新的涉及人类参与者或动物的研究。
进行 SLR 以识别已发表的 2 - 4 期随机对照试验(randomized controlled trials,RCTs)记录,这些试验聚焦于 16 岁及以上的中重度活动性 CD 成年或青少年患者。符合条件的试验采用活性对照或安慰剂对照设计,研究关键治疗药物,如英夫利昔单抗、阿达木单抗、赛妥珠单抗(certolizumab pegol)、维得利珠单抗、乌司奴单抗、古塞库单抗、瑞莎珠单抗、米立珠单抗、托法替尼(tofacitinib)、乌帕替尼、奥扎尼莫德(ozanimod)或依曲西莫德(etrasimod)。然而,如果试验研究的是在美国、加拿大、欧洲或日本获批的方案,且研究了维持阶段的治疗效果(或纳入维持试验),则被认为可能符合定量合成的条件。详细的纳入标准见补充材料第 1.1 节。
2023 年 7 月 27 日,检索了 EMBASE、MEDLINE 和 Cochrane Central 数据库。检索策略由医学信息专家制定,并使用电子检索策略同行评审(PRESS)清单进行同行评审。2023 年 7 月至 10 月,还在 ClinicalTrials.gov 网站上进行了额外检索,并查阅了 2022 年以来举行的关键临床会议资料。同时,审查了选定已发表 SLR 的参考文献。检索到的文献由两名独立评审员分两个阶段进行筛选(标题和摘要审查,然后是全文审查),分歧通过共识或由第三名评审员解决。全文审查期间排除的文献列表见补充材料第 1.3 节。使用标准化电子表格,由一名评审员提取试验特征和结局数据,并由第二名评审员进行验证。在有全文发表的情况下,依据约克大学评审与传播中心的指导进行质量评估。
在某些情况下,通过有针对性的文献回顾,从灰色文献来源(如卫生技术评估和监管报告)中获取了额外的试验数据,特别是延迟应答者、对安慰剂有反应的患者或感兴趣亚组的数据(详见补充材料)。
评估了进行古塞库单抗与对照治疗比较的 NMA 的可行性,重点关注基于 Tanaka 等人和 Cope 等人的指导,在患者特征和研究设计方面的试验间异质性。根据评估显示存在显著异质性的试验,或未提供两种感兴趣方案之间或与安慰剂的比较数据(即对网络无贡献或无法连接到网络)的试验,可能被判定不符合纳入 NMA 的条件。
感兴趣的结局是在治疗维持阶段结束时(使用最接近 52 周的时间点)的以下指标,定义参照 GALAXI 试验:
- 临床缓解:克罗恩病活动指数(Crohn’s Disease Activity Index,CDAI)评分 < 150。
- 临床应答:CDAI 评分较基线降低≥100 分或 CDAI 评分 < 150。
- 内镜缓解:简单内镜评分 - 克罗恩病(Simple Endoscopic Score-Crohn’s Disease,SES-CD)评分较基线改善≥50% 或 SES-CD 评分≤2。
- 内镜缓解和临床缓解的复合结局:SES-CD 评分较基线改善≥50% 或 SES-CD 评分≤2,且 CDAI 评分 < 150。
这些定义为首选定义,但如果认为替代定义对相对治疗效果影响极小,则也可纳入 NMA。
试验设计被确定为异质性的关键来源。一般来说,试验可以是全程治疗设计(treat-through design),即进入维持阶段不取决于诱导期的应答情况;也可以是重新随机化设计(re-randomized design),即只有诱导期应答者进入维持阶段,并重新随机分配接受活性治疗或安慰剂。采用重新随机化的试验本质上更具适应性,可优化临床和伦理效益;然而,它们与传统的全程治疗试验明显不同,在进行间接比较时应考虑这种异质性。还观察到其他试验设计的变化,进一步凸显了这种异质性来源。特别是,试验可能是混合类型,即活性组遵循标准的全程治疗设计,而最初随机分配到安慰剂且在诱导期末无应答的患者可转换为开放标签的活性治疗。每种试验设计估计的可能是不同的人群(例如,诱导期应答者与诱导期所有随机化患者),如果不加以处理,可能会在潜在分析中构成主要的偏倚来源。
先前的 NMA 通过计算来调整重新随机化试验的结局数据,以反映全程治疗设计,从而减少试验间的异质性。因此,随机撤药试验被标准化以模拟标准的全程治疗设计,即患者保持在诱导开始时随机分配的治疗序列中。方法主要遵循 NICE TA633 的方法。对于一些试验,特别是诱导期无应答或延迟应答的患者(即在重新随机化研究中通常在维持期末不进行评估的患者),需要进行数据插补(例如,使用其他试验的数据)或根据报告数据进行推导。总体而言,如果有更简单的全程治疗试验可将感兴趣的对照纳入网络而无需插补,则尽量减少为便于试验标准化而进行的插补,或尽量减少将不同的诱导期和维持期试验合并(详见可行性评估结果中的详细信息)。
在主要分析中,纳入的人群包括对先前治疗有不同反应的患者。欧洲克罗恩病和结肠炎组织(European Crohn’s and Colitis Organisation,ECCO)近期的临床指南不鼓励使用 “传统疗法” 这一术语,因为随着生物疗法越来越容易获得,并越来越被视为 CD 治疗的常规部分,该术语已过时。因此,计划对生物制剂治疗反应不足或不耐受的患者(BIOIR)和先前对生物制剂无治疗反应不足或不耐受的患者(non-BIO-IR)进行亚组分析。不同试验的亚组数据可用性不同,需要根据 NICE TA633 中的方法将亚组数据转换为混合人群数据,或将混合人群数据转换为亚组数据。关于标准化方法以及亚组或混合人群数据计算的更多详细信息见补充材料第 3.1 节。
使用 R 软件中的 Just Another Gibbs Sampler(JAGS)进行贝叶斯 NMA。临床缓解和临床应答作为一个有序终点,分为 3 类(无应答 / 缓解、应答但未缓解、缓解),使用有序分类数据的逆 logit 多元回归模型进行分析,而其余结局使用二项式似然模型。考虑到试验设计的差异,采用随机效应模型,并对试验间共享的异质性参数使用对数正态信息先验分布,以促进收敛并防止可信区间(credible interval,CrI)过宽。使用马尔可夫链蒙特卡罗方法生成相对治疗效果的中位数优势比(odds ratio,OR)和 95% CrI,并使用联赛表展示分析结果。CrI 不包含 1 被认为代表对照药物具有较高的疗效优势可能性,在本报告中,这种情况简称为 “显著”。累积排名曲线下面积(surface under the cumulative ranking curve,SUCRA)和中位数排名用于支持比较治疗方法的相对疗效,SUCRA 值范围从 0 到 1,表示一种治疗相对于理想治疗所达到的疗效百分比。
结果
SLR 和 NMA 可行性评估
在数据库检索中确定的 6695 条记录和其他来源确定的 1093 条记录中,SLR 共识别出 58 项 RCTs,分布在 137 个单独记录中。共有 29 项 RCTs 被认为可能符合纳入 NMA 的条件,其中 21 项评估了维持终点,其高级别详细信息总结在表 1(纳入 NMA 的试验)和表 2(排除在 NMA 之外的试验)中。研究选择过程的流程图见图 1。
所有确定的试验均为多中心 RCTs,且除开放标签的 SEQUENCE 试验外均为双盲试验。大多数试验也采用安慰剂对照,SEAVUE、SEQUENCE 和 SONIC 试验除外。8 项 RCTs 采用全程治疗设计,其余采用应答者重新随机化设计。所有预先指定的感兴趣的先进治疗方法均在多项试验中进行了研究,古塞库单抗在 3 项 GALAXI 试验中进行了研究。除 CERTIFI、PRECISE-1 和 PRECISE-2 外,所有试验至少在 48 周时评估了维持结局。
总体而言,纳入的 RCTs 被认为方法学质量良好(见表 S1.4)。各试验的纳入标准总体一致,但在先前治疗使用和失败相关标准方面存在差异。在被视为潜在效应修饰因素的基线特征方面,在年龄、基线 CDAI 评分和同时使用类固醇等多个特征上观察到广泛的同质性。
各试验的结局定义大致一致。在 3 项试验(ENACT 1、ENACT 2 和 ACCENT 1)中,基于 CDAI 的临床应答定义比大多数试验宽松(要求 CDAI 最低降低 70 分而非 100 分)。所有报告该结局的试验中,临床缓解的定义一致。虽然报告内镜缓解的试验较少,但在可审查的定义中观察到同质性。需要注意的是,在 FORTIFY 试验中,内镜缓解定义为 SES-CD 改善 > 50%(对于孤立性回肠疾病且基线 SES-CD 为 4 的患者,至少较基线降低 2 分),与 GALAXI 试验中定义的缓解为 SES-CD 改善≥50% 或 SES-CD 评分≤2 不同。
最后,在治疗维持阶段的安慰剂应答率方面存在异质性,这可能是由研究设计差异(如重新随机化)以及结局定义差异导致的。
总之,试验间异质性的关键来源包括试验设计的差异(全程治疗、重新随机化以及仅诱导或维持期的研究)、患者先前治疗暴露或失败的差异以及安慰剂应答率的差异。总体而言,这些问题不被认为会妨碍进行有效的 NMA,特别是考虑到事先计划根据需要对试验设计进行标准化。由于开放标签设计可能引入偏倚风险,SEQUENCE 试验被排除在 NMA 之外;然而,在可行的情况下,进行了敏感性分析,包括在调整与非盲法研究相关的偏倚并考虑治疗组间差异脱落的情况下纳入该研究(见补充材料第 2.3 节)。由于 SONIC 试验只有一个治疗组符合条件,因此被排除在 NMA 之外。
为尽量减少插补的使用,在已建立网络连接的情况下,6 项重新随机化试验被排除在 NMA 之外(详见表 2):SERENITY、EXTEND、CHARM、CLASSIC 1 和 2 以及 CERTIFI。对于 IM-UNITI 试验,这一重新随机化试验仅用于纳入每 12 周 90mg 乌司奴单抗的独特方案,该方案未在已确定的全程治疗试验中研究,并且通过每 8 周 90mg 乌司奴单抗与网络连接,无需使用和插补安慰剂组数据(见补充材料第 3.2 节)。由于存在开放标签诱导期,且有研究常见药物的盲法诱导方案的研究可用,PRECISE 2 和 VISIBLE 2 被排除在 NMA 之外。总体而言,13 项有维持期末数据的试验被纳入 NMA,其中 9 项在至少一个结局或治疗组中需要插补或推导数据。大多数插补是针对重新随机化设计研究中的诱导期无应答者,特别是安慰剂组。
网状 Meta 分析
- 临床应答:11 项试验(图 2a)对 12 种其他治疗方案(图 2b)的分析表明,两种古塞库单抗方案(200mg Q4W 和 100mg Q8W)比大多数对照药物显著更有效,包括赛妥珠单抗、维得利珠单抗、那他珠单抗(natalizumab)、乌帕替尼和英夫利昔单抗。古塞库单抗方案也比纳入的 IL-12/23 和 IL-23 靶向药物以及阿达木单抗更有效,但差异不显著。古塞库单抗是唯一比每 8 周 10mg/kg 英夫利昔单抗显著更有效的治疗方法(对于 200mg Q4W 的古塞库单抗,OR = 3.21,95% CrI:1.32 - 8.24;对于 100mg Q8W 的古塞库单抗,OR = 2.83,95% CrI:1.17 - 6.99)。在对照药物中,200mg Q4W 和 100mg Q8W 的古塞库单抗 SUCRA 值分别排名第一和第二(图 3)。SUCRA 代表一种药物优于其对照药物的平均概率。古塞库单抗平均有 87.5% 的概率比其他对照药物更好,这一高 SUCRA 值表明古塞库单抗方案可能在所有治疗对照中具有最高疗效。
- 临床缓解:12 项试验(图 4a)对 13 种其他治疗方案(图 4b)的分析表明,两种古塞库单抗方案比大多数对照药物显著更有效,包括每日 15mg(QD)的乌帕替尼、英夫利昔单抗、那他珠单抗、赛妥珠单抗和维得利珠单抗。此外,在所有对照药物中,只有 200mg Q4W 的古塞库单抗比 30mg QD 的乌帕替尼显著更有效(OR = 2.67,95% CrI:1.19 - 6.07),并且比 IL-12/23 和 IL-23 靶向药物以及阿达木单抗更有效,但差异不显著。在对照药物中,200mg Q4W 和 100mg Q8W 的古塞库单抗 SUCRA 值分别排名第一和第三(图 3)。
- 内镜缓解:7 项试验(图 5a)对 7 种其他治疗方案(图 5b)的分析表明,两种古塞库单抗方案比乌司奴单抗显著更有效(对于 200mg Q4W 的古塞库单抗,OR = 1.94,95% CrI:1.23 - 3.10;对于 100mg Q8W 的古塞库单抗,OR = 1.62,95% CrI:1.0