
-
生物通官微
陪你抓住生命科技
跳动的脉搏
解决中枢神经系统试验中评分者功能解盲的方法
【字体: 大 中 小 】 时间:2025年02月10日 来源:Translational Psychiatry 5.8
编辑推荐:
在临床试验领域,主观结局测量受未成功盲法的影响较大,易导致治疗效果被夸大,而 CNS 相关研究使用的评估工具中,很多项目都比较主观,需要临床医生谨慎判断 。早期的精神药物,如第一代抗精神病药物、抗焦虑药和三环类抗抑郁药,因其独特的副作用和使用惰性安慰剂,很难真正实现盲法。尽管新型精神药物安全性有所提升,副作用不那么明显,但仍有部分会引发独特的副作用,进而可能导致功能揭盲。比如,治疗难治性抑郁症的艾司氯胺酮输注会引发解离反应,使试验中的评估者和参与者猜出谁接受了试验药物
在精神疾病的治疗研究中,临床试验结果的准确性和可靠性至关重要。来自波士顿的 Steven D. Targum 等研究人员在《转化精神病学》(Translational Psychiatry)期刊上发表了题为 “Methods to address functional unblinding of raters in CNS trials” 的论文。这一研究聚焦于中枢神经系统(CNS)试验中评估功能揭盲的方法,对提高临床试验的质量、确保研究结果的可信度有着重要意义。通过探究药物治疗过程中出现的不良事件是否会影响临床评估的公正性,该研究为后续的精神疾病药物研发和临床试验设计提供了关键的参考依据。
在临床试验领域,主观结局测量受未成功盲法的影响较大,易导致治疗效果被夸大,而 CNS 相关研究使用的评估工具中,很多项目都比较主观,需要临床医生谨慎判断 。早期的精神药物,如第一代抗精神病药物、抗焦虑药和三环类抗抑郁药,因其独特的副作用和使用惰性安慰剂,很难真正实现盲法。尽管新型精神药物安全性有所提升,副作用不那么明显,但仍有部分会引发独特的副作用,进而可能导致功能揭盲。比如,治疗难治性抑郁症的艾司氯胺酮输注会引发解离反应,使试验中的评估者和参与者猜出谁接受了试验药物(IP)。
功能揭盲通常发生在 IP 的固有属性产生的治疗紧急不良事件(TEAEs)能够区分 IP 和安慰剂时。一旦出现功能揭盲,可能会改变期望偏差,放大治疗效果,因为临床评估者和参与者可能会因这些副作用而错误判断自己接受的治疗,进而影响临床评估的完整性和对试验结果的信心。然而,多数 CNS 试验并未对功能揭盲的可能性进行评估。相关文献回顾显示,在 2000 - 2010 年间的 CNS 精神分裂症和情绪障碍试验中,仅有 2.5% 的研究直接询问参与者或评估者对治疗组分配的看法来评估盲法是否成功;在 2000 - 2020 年的抗抑郁药研究荟萃分析中,也仅有 7.1% 的研究包含盲法评估信息。
本研究的数据分析基于三项针对成人精神分裂症急性发作患者的 5 周随机、双盲、安慰剂对照试验,这三项试验分别是 EMERGENT - 1、EMERGENT - 2 和 EMERGENT - 3(ClinicalTrials.gov 标识符:NCT3697252、NCT04659161、NCT04738123),由 Karuna Therapeutics 赞助,在美国和乌克兰的研究中心开展。试验参与者为 18 - 65 岁(EMERGENT - 1 中上限为 60 岁)的精神分裂症患者,需满足《精神疾病诊断与统计手册》第 5 版的诊断标准,且 PANSS 总分在 80 - 120 之间,关键阳性症状项目中有至少两项得分不低于 4 分,临床总体印象严重程度评分在筛查和基线访视时至少为 4 分。参与者被随机分为口服 xanomeline/trospium 组或安慰剂组,按 1:1 的比例进行为期 5 周的治疗,xanomeline/trospium 的剂量会逐步滴定至最大剂量(xanomeline 125 mg/trospium 30 mg,每日两次)。
在伦理方面,三项研究均遵循《赫尔辛基宣言》和国际协调会议制定的《药物临床试验质量管理规范》,试验方案和知情同意书经过独立伦理委员会和集中机构审查委员会的审核批准,参与者在试验前均签署了书面知情同意书。
研究人员比较了远程评估者(对试验现场、访视、TEAEs 不知情)对 PANSS 总分的评分和现场评分。现场的 PANSS 访谈由经过培训的评估者使用结构化临床访谈进行,每次访谈都进行音频数字化记录并传输至 Signant Health 进行质量审核。远程评估者通过查看包含信息提供者信息的数字笔记,聆听并对现场访谈的音频进行评分。由于无法直接观察参与者行为,N1(情感平淡)、G4(紧张)、G5(怪癖和姿势)和 G7(运动迟缓)这 4 个需要直接观察的项目,其评分沿用现场评分,以此生成远程 PANSS 总分。
在三项研究中,研究人员按类型对 TEAEs 进行分类,并按治疗组进行汇总。不良事件被定义为临床试验参与者中出现的任何不良医学事件,无论其是否与 IP 相关。在事后亚组分析中,研究人员不仅检查了所有报告的 TEAEs,还特别关注了可能与 xanomeline/trospium 相关的胆碱能不良事件,这些不良事件按照《监管活动医学词典》的标准进行界定,涵盖了恶心、呕吐、腹泻等多种症状。
本研究采用修正的意向性分析(mITT)人群进行数据分析,mITT 人群定义为接受至少一剂试验药物、有基线 PANSS 评估且至少有一次基线后 PANSS 评估的随机参与者。
在比较配对的现场和远程评分时,研究人员先计算基线和终点评估时配对评分之间的组内相关系数(ICC),以此评估现场和远程评分的一致性;接着使用协方差分析(ANCOVA)模型,在调整基线 PANSS 总分、治疗组、评估者类型、研究、年龄和性别以及治疗组与评估者类型的交互作用后,评估 xanomeline/trospium 的治疗效果;最后,以 PANSS 总分从基线到终点改善 30% 及以上作为治疗反应的标准,进行应答者分析。
在比较基于 TEAE 的亚组时,研究人员在四个亚组(报告可能与试验药物相关的胆碱能 TEAEs 的参与者、未报告此类 TEAEs 的参与者、报告任何 TEAEs 的参与者、未报告任何 TEAEs 的参与者)中,分别计算基线和终点时现场和远程评分的 ICC,并评估治疗效果。对于现场评分,使用重复测量的混合模型(MMRM)估计 xanomeline/trospium 与安慰剂从基线到终点的差异;对于远程评分,使用 ANCOVA 模型探索治疗组在终点的差异。所有统计检验均为双侧检验,显著性水平 α = 0.05,且未采用多重比较技术,统计分析使用 SAS for Windows 9.4 和 IBM SPSS for Windows 28.0 软件进行。
本研究共纳入 575 名参与者,占总招募人数的 95% 以上,其中 xanomeline/trospium 组 286 人,安慰剂组 289 人。基线和终点时,575 对现场和远程 PANSS 总分的 ICC 较高(分别为 0.88 和 0.93,均 p < 0.001)。使用 26 个 PANSS 项目(不包含 4 个沿用现场评分的项目)分析时,基线和研究终点时现场和远程评估者之间的 ICC 分别为 0.75 和 0.85(均 p < 0.001)。
从治疗效果来看,无论是现场评分还是远程评分,xanomeline/trospium 组在 PANSS 总分上的改善均显著优于安慰剂组(均 p <0.0001),且没有证据表明现场和远程评估者对 xanomeline/trospium 治疗效果的评估存在显著差异(治疗 × 评估者类型交互作用 p = 0.172)。在治疗应答方面,xanomeline/trospium 组基于现场评分的应答者比例为 44.4%,基于远程评分的应答者比例为 36.4%,均显著高于安慰剂组(现场评分:χ2 = 36.7,df = 1,p < 0.0001;远程评分:χ2 = 19.8,df = 1,p < 0.0001)。同时,现场评分和远程评分中 xanomeline/trospium 组参与者的改善比例无显著差异(χ2(1, N = 346) = 0.42,p = 0.52),远程评分与现场评分治疗应答结果的总体预测价值为 88.0%。
在三项研究合并的安全人群(n = 683)中,407 名参与者(59.6%)报告了至少一种 TEAE。xanomeline/trospium 组有 68% 的参与者、安慰剂组有 51% 的参与者在试验期间经历了至少一种 TEAE。最常见的胆碱能 TEAEs 包括恶心、便秘、消化不良和呕吐,这些症状通常在治疗的前两周出现,多为轻度至中度的短暂症状,未导致试验中断。xanomeline/trospium 未出现典型的抗精神病药物副作用,如锥体外系症状、嗜睡或体重增加。
对于有现场评分的参与者(n = 586),xanomeline/trospium 组在 PANSS 总分上的显著改善与是否出现胆碱能相关 TEAEs 或任何 TEAEs 均无关(所有分析 p < 0.001)。Cohen's d 效应量分析显示,在 mITT 人群、报告胆碱能相关 TEAEs 的亚组、未报告胆碱能 TEAEs 的亚组以及未报告任何 TEAEs 的亚组中,xanomeline/trospium 组在 PANSS 总分上均优于安慰剂组,且效应量相似。另外,分析中剔除 4 个沿用远程评分的项目后,效应量结果相似。
在有配对现场和远程评分的 575 名参与者中,213 人(37.0%)报告了胆碱能相关 TEAEs,348 人(60.5%)报告了任何类型的 TEAEs。无论是否报告胆碱能相关 TEAEs 或任何 TEAEs,基线和终点时现场和远程 PANSS 总分之间的 ICC 无差异(ICC 范围在 0.86 - 0.94 之间,所有情况 p < 0.001)。报告胆碱能相关 TEAEs 的亚组中,xanomeline/trospium 组相对于安慰剂组的 LS 平均差异为?8.6 ± 2.37(SE);未报告该类 TEAEs 的亚组中,这一差异为?8.3 ± 1.69,两组均 p < 0.001,说明试验期间是否报告胆碱能相关 TEAEs 不影响 xanomeline/trospium 显著优于安慰剂的结果。
在对胆碱能相关 TEAEs 发生时间与试验结果关系的二次分析中,发现 213 名报告该类 TEAEs 的参与者中,81.7% 在双盲治疗的前两周出现症状。前两周内是否出现胆碱能相关 TEAEs 不影响现场 PANSS 试验结果,报告早期胆碱能相关 TEAEs 的 xanomeline/trospium 组参与者和未报告的参与者,均显著优于安慰剂组参与者。
在有现场和远程评分的 575 名参与者中,213 人报告了胆碱能相关 TEAEs。与现场评分结果一致,基于远程评分,xanomeline/trospium 组在 PANSS 总分上的显著改善与是否出现胆碱能相关 TEAEs 或任何 TEAEs 均无关。Cohen's d 效应量分析显示,在 mITT 人群、报告胆碱能相关 TEAEs 的亚组、未报告胆碱能 TEAEs 的亚组以及未报告任何 TEAEs 的亚组中,xanomeline/trospium 组在远程评定的 PANSS 总分上均优于安慰剂组,且效应量相似。剔除 4 个沿用远程评分的项目进行敏感性分析,效应量略低但仍相似。
研究人员运用两种不同的方法对三项 xanomeline/trospium 与安慰剂对比治疗精神分裂症急性发作的研究进行分析,结果表明,胆碱能副作用或任何 TEAEs 的存在与否均未对试验结果产生影响。在第一项方法中,远程评估者在对 TEAEs 不知情的情况下,其基于音频记录得出的 PANSS 总分能够很好地复制现场评分;第二项方法通过对不同 TEAE 报告情况的亚组分析,发现无论参与者是否报告胆碱能相关 TEAEs 或任何 TEAEs,xanomeline/trospium 组在 PANSS 总分上的改善均显著优于安慰剂组。
本研究中,xanomeline/trospium 治疗期间最常报告的 TEAEs 是胆碱能相关事件,但这些事件并未影响试验结果。远程评估者虽然无法直接观察参与者和获取 TEAE 信息,却能高度重现现场评估者的 PANSS 评分,且两组评分均显示 xanomeline/trospium 组在治疗 5 周后 PANSS 总分上显著优于安慰剂组,远程评估者对现场评估者治疗应答结果的预测价值高达 88.0%。这进一步证实,现场评估者对胆碱能相关 TEAEs 的知晓几乎未对试验结果造成影响。
此次研究结果与 Marder 等人的研究有所不同。Marder 等人认为喹硫平 XR 的镇静特性可能导致部分评估者功能揭盲,影响了对 brexpiprazole 试验结果的评定,因为在该试验中,brexpiprazole 在主要测量指标 PANSS 总分上未与安慰剂区分开来,但在事后分析中,一小部分经历喹硫平样 TEAEs 的参与者使用 brexpiprazole 治疗时,PANSS 总分显著优于安慰剂组 。然而,本研究认为在多数 CNS 研究中,未询问评估者和参与者对治疗分配的猜测,很难确定是功能揭盲还是药物副作用带来的治疗益处影响了试验结果。
虽然本研究未发现功能揭盲对试验结果有明显影响,但也不能完全排除功能揭盲的发生。有可能盲法是成功的,或者因 TEAEs 导致的功能揭盲对基于 PANSS 评分的结果影响不大。本研究使用的两种方法存在一定局限性,仅考虑了评估者的功能揭盲问题,未涉及参与者的观点和期望。参与者对治疗分配的认知,无论正确与否,都可能影响其治疗反应。此外,多数临床试验未询问参与者和评估者对药物分配的猜测,这使得对功能揭盲对试验结果的影响解释变得复杂。期望偏差、试验过程中的感知反应以及 TEAEs 等因素,都可能影响和混淆试验结果的解释。
总体而言,本研究中评估功能揭盲可能性的两种分析方法表明,在 xanomeline/trospium 治疗精神分裂症的试验中,胆碱能副作用或任何 TEAEs 均未对试验结果产生影响。事后分析 IP 相关 TEAEs 与结果的关系,以及使用对 TEAEs 不知情的远程评估者,都是评估功能揭盲对试验结果潜在影响的有效方法。但这两种方法无法解决参与者对治疗分配的认知问题,未来仍需评估评估者和参与者对治疗分配的看法,探索认知对治疗结果的作用,进一步研究功能揭盲对真实药物效果放大或缩小的影响。这一研究为后续临床试验在评估功能揭盲方面提供了重要的参考,有助于优化试验设计,提高精神疾病药物临床试验结果的可靠性和有效性。
生物通微信公众号
知名企业招聘