《Pharmaceutical Statistics》:A Statistical Concept for Conditional Marketing Authorisation Based on the Intermediate and Final Outcomes of a Single Confirmatory Randomised Clinical Trial
编辑推荐:
这篇综述为寻求有条件上市授权(CMA)的临床试验设计提供了一个严谨的统计学框架,指出传统的双重主要终点(如Bonferroni拆分法)与临床决策不匹配,并提出了将中期和最终终点视为共同主要终点、各自采用标准群组序贯设计(GSD)的新策略。该方案在控制I类错误(T1E)的同时,更好地协调了统计学意义与监管决策,且对样本量和试验时长影响甚微。
引言
在欧盟,有条件上市授权(CMA)是为解决未满足医疗需求的新药提供早期市场准入的重要路径。其核心要求是获益风险比为正,且申请人能在授权后提供全面数据以将CMA转为完全上市授权(MA)。近年来的一个创新提议是,设计一项包含中期分析的单一随机临床试验,并基于一个中期终点和一个最终主要终点的结果来决定CMA和完全MA。为了控制研究层面的I类错误(T1E),此前提出了双重主要终点概念,实质上是在中期和最终终点之间对研究层面的T1E进行Bonferroni拆分。然而,本文认为这种形式上的研究成功定义与对试验总体结果的临床评估并不一致。
规划考量
在CMA的背景下,双重主要终点概念通过将研究层面的T1E拆分给中期和最终终点来应用。其意图可能是基于中期终点的正式显著效应来决定CMA。但这与监管决策不符。如果需要通过具体义务来解决疗效问题,主要目标仍然是证明最终终点的疗效,作为得出结论性研究成功和总体积极试验结果的基础。即使中期终点与最终终点存在相关性或替代性可能,最终终点的显著性也并非必然保证。因此,与EMA关于临床试验中多重性问题的指南一致,中期和最终终点应被定义为共同主要终点。
针对已讨论方法的上述问题,本文提出了一种替代策略:将中期和最终终点视为共同主要终点,各自使用标准的群组序贯设计测试程序进行评估。该策略保留了双重主要终点方法的优点,即即使中期终点在中期分析中未达到统计学显著性,研究也可继续进行到最终终点的最终分析。同时,在进入关于所研究实验性治疗获益风险的讨论之前,统计学和临床关于研究成功的结论是一致的。
通常,中期和最终终点的中期和最终分析应设置在相同的时间点,因为在CMA时,不仅应证明中期终点的显著治疗效果,也可能需要为获益风险评估提供足够量的最终终点数据。形式上,这可以通过在中期分析中为最终终点纳入一个具有预先设定的非劣效性(NI)界值的非劣效性检验来实现,采用Wang等人引入的群组序贯封闭测试程序。
通过为两个共同主要终点规划不同的信息分数,使用两个独立的alpha消耗函数,各自消耗直至共同最终分析的完整alpha,可以实现额外的灵活性。中期和最终终点随后可以在中期和最终分析中以不同的调整后T1E进行测试。具体情境总结如下:
- •
如果中期和最终终点在中期分析中均显著,则试验在中期分析时已正式成功,如果总体获益风险比被认为是正的,则可直接授予完全MA。
- •
如果仅中期终点在中期分析中显著,且最终终点未显示损害(或可显示积极趋势),则可证明CMA合理,试验将进行至最终分析。若最终终点在最终分析中显著,则试验正式成功,假设没有其他发现质疑积极的获益风险比,CMA可转为完全MA。
- •
如果中期终点在中期分析中不显著,试验可进行至最终分析。如果中期和最终终点在最终分析中均显著,则从统计学角度支持完全MA,试验正式成功。
当然,在共同主要和双重主要终点方法中,都可能出现中期终点在最终分析中未显示显著治疗效果,而仅有最终终点在试验结束时显著的情况。即使在最终终点未显示优效性的情况下,也可能通过深入的获益风险评估接受将已授予的CMA转为完全MA。此时,最终终点的积极趋势可能足以支持其转为完全MA。因此,强烈建议在试验规划阶段就预先设定一个严格(小)的非劣效性界值,以确保预期的积极趋势。然而,如果在最终分析中既不能证明最终终点优效,也不能证明其达到预先设定的非劣效性界值,则试验被视为正式不成功。
示例
一项随机对照的关键性III期肿瘤学临床试验计划证明一种新疗法(N)相较于标准疗法(S)的优效性,用于拟议适应症的上市授权申请。最初提出以完全缓解(CR)作为中期终点、总生存期(OS)作为最终终点的双重主要终点。计划基于CR的显著效应申请CMA,并在显示OS显著效应时转为完全MA。为了将研究层面的T1E强控制在0.025,提出了在两个主要终点之间对完整alpha进行不对称Bonferroni拆分,其中将单侧alpha 0.002分配给CR,0.023分配给OS。总共计划在试验期间的两个时间点进行两次分析,中期和最终分析将分别评估CR和OS。
为了使正式研究成功的统计标准与临床标准保持一致,本文提出将CR和OS视为共同主要终点。在此情况下,每一项都可以在单侧alpha水平0.025下进行检验。计划在共同时间点为CR和OS进行一次中期和一次最终分析。修订后的设计提案,与其使用双重主要终点方法的对应方案相比,既不会导致所需患者数量的增加,也不会延迟计划中CMA和完全MA的时间线。
由于CR在中期分析中的信息分数减少至约53%,相应地,中期分析可以比原计划更早的时间点进行,但检验效能降低。如果在中期分析中无法达到统计学显著性,CR在最终分析中仍有很大机会,因为在共同主要终点概念下,每个终点都可以在完整的0.025 alpha下进行检验。对于共同主要终点,通常建议将每个终点的检验效能提高至90%,以达到80%的整体效能。虽然将OS的检验效能提高到80%以上仍然是明智的,但这可能并非严格必要,因为研究中的患者数量完全由最终终点OS驱动,而中期终点在大多数情况下实质上被过度检验了。
另一种提议是对CR使用Hwang-Shih-DeCani消耗函数。通过设置消耗函数中gamma参数的不同值,可以考虑CR在中期分析中的不同信息分数,同时分配给CR在中期分析中的alpha仍与原计划相似。Hwang-Shih-DeCani消耗函数使得在中期分析中可以利用比O'Brien-Fleming型消耗函数更多的信息,以防希望提高CR在中期分析中的检验效能。随着CR在中期分析中信息分数的增加,相应地,中期分析将在表3所示的研究计划之后的时间点进行。表4中的研究计划可以通过基于规划假设,明确预先设定最终终点在中期分析的预期证据水平(通过一个严格(小)的非劣效性界值来反映可以排除何种程度的劣效/损害,或可以显示何种积极趋势)来加以补充。
讨论
本文讨论了迄今为止为CMA提出的各种方法。双重主要终点方法具有一些优点:在中期和最终终点之间进行T1E的Bonferroni拆分在统计学上是正确的且易于实施;一旦中期终点的零假设被拒绝,作为CMA积极决策的基础,研究即正式成功;一旦中期终点显示统计学显著性,通过将分配给中期终点的T1E传递到最终终点的评估,可以实现T1E的有效利用;尽管中期终点结果为阴性,研究仍可能有机会基于最终终点在结束时的阳性结果而正式成功,并考虑授予完全MA。
尽管有诸多优点,但双重主要终点方法与临床决策不符,因为即使观察到中期终点的显著发现,临床决策也不能忽略最终终点潜在的阴性发现。只要疗效方面仍存在不确定性,完全MA的具体义务就应包括基于最终终点证明疗效。因此,中期和最终终点应被视为共同主要。在此,最终终点疗效的正式证明是得出试验正式成功结论的先决条件,结合中期终点持续显著的积极效应和积极的获益风险比,使试验有资格获得完全MA。如果中期终点不显著,具有最终终点疗效正式证明的试验可能仍有资格进行完全MA的获益风险评估,前提是中期和最终终点之间的不一致性能得到充分解释,并被认为对疗效和安全性特征没有负面影响。
本文阐明,将中期和最终终点视为共同主要、使用标准群组序贯设计测试程序评估每个终点的方法,是一种有效且灵活的策略,可将CMA及后续完全MA的决策基于同一项临床试验。通过仔细选择中期和最终终点的GSD,特别是中期分析各自的时机/信息分数,该策略与其使用双重主要终点方法的对应方案相比,既不会导致总样本量的增加,也不会延迟CMA的时间。选择进行中期分析的适当时机本身就具有挑战性,需要考虑多个方面。通常,中期分析的时机可能受以下要求驱动:招募工作几乎完成,并且有足够的最终终点信息可用于初步的获益风险评估。
当然,可以计划在中期终点“所有”信息可用时进行中期分析,并在中期分析时为中期终点消耗完整的alpha。这假设对中期终点的治疗效果或中期与最终终点之间的相关性没有被高估。一方面,放弃对中期终点的GSD测试程序可以最大化证明中期终点优效的检验效能,从而增加获得CMA的机会。另一方面,这带来了风险:如果中期终点在中期分析时未能在完整alpha水平上显著,那么无论最终分析的可能结果如何,研究将已经被视为正式不成功,理论上不应进行最终分析。因此,将中期终点的GSD测试程序纳入共同主要终点概念,提供了一个在中期和最终结果之间的相关性仍属推测时,平衡授予CMA和完全MA机会的可能性。
基于同一试验进行CMA和完全MA决策具有主要优势。然而,此类方法的主要风险在于,由于中期终点的中期分析可能会损害研究的完整性。由于该分析旨在用于监管提交,这意味着研究将被全面分析和报告,因此结果可供申办方、研究者、科学界和试验中的患者使用。这可能会给研究引入难以准确量化的偏倚,并可能影响研究的进一步进行以及对完全MA至关重要的最终终点的评估。
对于双盲研究,在患者和研究者层面仍可保持盲态。因此需要两项措施来保护研究完整性并确保研究完成:首先,中期终点的中期分析应计划得足够晚,以便入组至少接近完成。其次,研究应是双盲的,并且在中期分析进行和结果传达后,需要谨慎行事以确保患者和研究者的盲态得以保持。应委托独立的数据监查委员会进行中期分析,并且只有在满足CMA条件时,申办方才应进行准备CMA申请的全面分析。DMC的这次初步分析最好还包括在建议启动CMA程序之前对积极的获益风险比进行评估。
诚然,由于治疗方案存在显著差异,在某些情况下不可能实施盲法。很难预见在组别信息不可避免地公开后,如何确保无偏倚的评估。在这些情况下,所提出的策略可能不值得冒额外的风险,因为试验设计必须允许中期分析和最终分析之间只有很短的时间。因此,如果中期分析计划在公布中期发现不会影响进一步试验进行或评估的时间点,那么市场准入时间的收益将微不足道。
尽管本文主要使用肿瘤学示例进行说明,但所提出的方法也可能适用于其他非肿瘤学适应症。此外,也存在所提出的方法可能无法有意义实施的适应症。例如,对于代谢功能障碍相关脂肪性肝炎,获得MA的一般程序是基于可接受的短期中期终点,然后是长期最终终点。由于疾病通常进展缓慢,可能需要数年时间才有足够数量的患者显示出进展。因此,很难为中期和最终终点规划一个共同的中期分析,在不显著增加样本量或延迟CMA时间的情况下,获得足够的最终终点信息。然而,操作上的困难并不能自动证明双重主要终点概念的合理性。如何为这种特定适应症有意义地实施共同主要终点概念值得进一步研究和讨论。