编辑推荐:
该研究通过一项随机临床试验,发现结合基于证据的患者视频决策辅助工具与临床医生沟通技能培训的干预措施,能显著提高老年晚期癌症患者预立医疗照护计划(ACP)的记录率,为提升医疗服务质量提供新范式。
研究背景
在医疗领域,患者与临床医生就治疗目标展开讨论,对推动以患者为中心的高质量医疗服务意义重大。通过了解患者对当前和未来医疗护理的偏好,能在疾病晚期更好地调整干预措施,使其与患者目标相符。然而,现实中多数医疗系统对预立医疗照护计划(Advance Care Planning,ACP)活动的电子健康记录(Electronic Health Record,EHR)情况并不理想,记录率低且缺乏一致性。这使得患者难以获得契合自身目标的医疗服务,风险显著增加。
造成这种情况的原因主要有两方面。一方面,患者对相关知识的了解有限,同时面对情感上较为沉重的话题,往往会有所顾虑,不太愿意主动提及 。另一方面,临床医生由于缺乏清晰的沟通框架,在开启这类讨论时也缺乏足够的信心 。
视频决策辅助工具能够帮助患者了解潜在的选择,而沟通技能培训则可以让临床医生更有能力应对这类艰难的对话。特别是在 COVID-19 大流行期间,医疗系统迫切需要可扩展的干预措施,来改善 ACP 沟通和记录情况,对于 65 岁及以上患有严重疾病(如晚期癌症)的老年患者来说,这种需求更为迫切。基于此,研究团队开展了一项大规模的实用性随机临床试验,旨在探究将面向患者的视频决策辅助平台与临床医生高级沟通技能培训相结合,相较于常规护理,对老年晚期癌症患者 ACP 记录的影响。
研究方法
- 试验设计与监督:这是一项大规模、多中心的实用型阶梯楔形整群随机临床试验,将视频决策辅助和沟通技能培训项目(干预组)与常规护理(对照组)进行对比。试验于 2020 年 4 月 1 日至 2022 年 11 月 30 日开展,数据收集工作在 2024 年结束。考虑到干预措施涉及临床医生培训和在门诊使用决策辅助工具,随机化以门诊单元为单位进行。这种设计既便于实施,又能在对照期将干扰风险降至最低。
试验开始时共有 36 家诊所参与,其中 6 家诊所在 COVID-19 大流行前(2019 年 9 月)就接触了干预措施。但在 2020 年 3 月,所有试验活动都暂停了。2019 年对 36 家诊所进行首次随机分组后,2020 年 4 月又对剩余的 30 家诊所重新随机分组,以此来应对大流行带来的时间效应影响。最终研究报告的数据来自 30 家诊所中的 29 家,有 1 家诊所因与所属医疗系统脱离关系,导致数据无法获取。
每个诊所(群组)都从对照阶段开始,在 2.5 年的时间里,按照随机分配的时间(楔形阶段)过渡到干预阶段。这 29 家基于疾病的肿瘤诊所来自美国南部、中西部和大西洋中部地区的 3 个医疗系统。为了便于结果报告,这 3 个医疗系统选择匿名。在研究过程中,设立了数据安全和监测委员会,并获得了达纳 - 法伯癌症研究所机构审查委员会的批准。鉴于该干预措施是在常规护理基础上进行的强化标准测试,风险较低,机构审查委员会豁免了个人知情同意。不过,研究团队还是通过张贴传单等广播通知技术,向患者告知了正在进行的试验。本研究遵循了《临床试验报告统一标准》(CONSORT)的报告指南。
- 患者选择:符合条件的患者需满足以下条件:一是在每个阶段开始时年龄在 65 岁及以上;二是在参与试验的诊所中接受过任何临床医生的诊疗;三是患有晚期癌症。此外,患者还必须至少有 2 次之前到诊所的就诊记录(包括面诊或远程医疗),并且在每个阶段的 6 个月内至少有 1 次就诊记录。
对于该研究中的晚期癌症,具体定义如下:所有被诊断为淋巴瘤、白血病、骨髓瘤或脑肿瘤的患者;对于其他所有实体瘤恶性肿瘤,依据《国际疾病及相关健康问题统计分类(第十版)》的编码(包括所有子编码),C77.X、C78.X 和 C79.X(C77 代表淋巴结继发性和未特指的恶性肿瘤;C78 代表呼吸和消化器官继发性恶性肿瘤;C79 代表其他和未特指部位的继发性恶性肿瘤 )。研究没有设定排除标准,但最终分析时,排除了明确拒绝将其记录用于研究的患者以及所有欧盟地址患者的临床数据。
- 干预措施:此次干预整合了两种先前经过测试的独立干预措施,研究团队假设这两种措施结合后,能以叠加的方式改善治疗目标沟通情况。
面向患者的视频决策辅助工具经过认证,涵盖了一系列主题,如治疗目标、姑息治疗、临终关怀以及限制维持生命的干预措施等。这些工具以共同决策理论为基础,旨在帮助患者和决策者明确治疗目标,并促进沟通。它们有 25 种语言版本,已被证实可以提升患者对 ACP 的认知和确定性,增加 ACP 记录,以及实现与目标一致的医疗护理。
临床医生沟通技能培训项目(VitalTalk)在国际上已推广至 50000 多名临床医生,是 10 家专门癌症中心联盟中 6 家医院采用的核心重症疾病培训模式。该培训项目基于一套沟通框架,临床医生先学习该框架,然后通过实践和反馈来提升自身沟通技能。掌握这个框架后,临床医生能够更清晰地传达严重病情的消息,更好地回应患者情绪,了解患者的治疗目标,进而增强患者对肿瘤医生的信任。
当每个诊所进入干预阶段时,其临床医生(包括医生和高级执业临床医生)都有资格参加为期半天的现场虚拟沟通培训。沟通培训的实施效果通过 6 个月内接受培训的合格员工比例来评估。诊所内所有患有晚期癌症的患者,都可以按照临床医生的指导,远程或现场使用视频决策辅助工具。视频使用情况会被跟踪记录,以此来监测视频决策辅助工具部分的实施效果。
- 结果与数据收集:研究的主要终点是临床医生诊疗过程中 EHR 里的 ACP 记录情况。研究团队使用经过验证的自然语言处理(Natural Language Processing,NLP)软件(ClinicalRegex,版本 1.1.2;林德瓦尔实验室,达纳 - 法伯癌症研究所)辅助人工判断临床记录自由文本中记录的 ACP 沟通情况,并将其作为主要结果。ACP 沟通涵盖了关于治疗目标、限制维持生命治疗、姑息治疗或临终关怀的任何记录。研究人员对治疗组的分配情况不知情,在软件中进行评估。具体流程是,每个站点经过培训的研究人员,会对 NLP 从所有肿瘤 EHR 记录中识别出的每个患者的文本块进行评估。同时,研究团队使用训练数据集进行持续的质量保证工作,以确保每个站点的评估标准一致。
- 统计分析:研究主要采用意向性分析方法,不专门考虑不依从或未遵守方案的情况。将干预期和对照期的结果进行对比。由于采用开放队列设计,研究过程中人员会有变动,个体可能离开,也可能有新成员加入。而且,同一患者可能在多个阶段提供数据,既可能在对照期,也可能在干预期提供数据。
研究人员使用具有二项分布和恒等链接的广义线性模型,通过调整日历时间(作为分类变量)和站点来估计治疗效果。采用广义估计方程方法,利用复合对称协方差结构,来处理每个诊所内的聚类情况以及同一患者随时间的重复测量数据。
此外,研究团队还通过检验治疗状态与亚组之间的相互作用,探究不同亚组中干预效果的异质性。这些亚组包括站点、癌症诊断类型、作为生物学变量的性别,以及种族和民族(将白人与少数种族和民族群体进行对比;由于少数种族和民族群体患者数量较少,为便于分析,将除白人外的所有种族和民族合并为一个类别,即少数种族和民族群体 )。种族和民族信息由患者根据 EHR 中的分类自行报告。研究人员对种族和民族进行评估,是因为预先设定了对白人和少数种族和民族群体患者的分析。所有分析均使用 SAS 9.4 版本(SAS 研究所)完成。
研究团队采用胡珀等人的方法进行样本量计算和功效分析。估计每个时间点 30 个肿瘤诊所会有 4160 名患者符合研究条件,分析中总共会纳入 7500 名独特患者。根据队列设计,每个诊所每个阶段平均贡献 139 名患者。假设组内相关系数为 0.05,聚类导致的设计效应估计为 7.9;假设聚类自相关系数为 0.7,个体自相关系数为 0.9,重复评估导致的设计效应为 0.12。这些估计结果对应的有效样本量(即个体随机化所需的样本量)为 4405。该研究有超过 90% 的功效,能够在双侧显著性水平 α = 0.05 的情况下,检测出 ACP 记录率 10% 的绝对增加(主要结果)。
研究结果
- 患者基本信息:在研究期间,共有 13800 名独特患者符合纳入标准,其中 8533 名患者的数据用于对照期分析,9746 名患者的数据用于干预期分析。考虑到重复测量,这些患者总共提供了 29357 次测量数据。患者的平均(标准差)年龄为 74.5(6.6)岁,男性占 52.3%(29357 次测量中有 15344 次),女性占 47.7%(29357 次测量中有 14013 次)。在种族和民族方面,美国印第安人或阿拉斯加原住民有 62 人(占 0.2%),亚裔 1035 人(占 3.5%),黑人 3433 人(占 11.7%),西班牙裔 846 人(占 2.9%),夏威夷原住民或其他太平洋岛民 10 人(占 0.03%),多民族 11 人(占 0.04%),其他种族和民族 1717 人,白人 22271 人(占 75.9%)。这些患者在 3 个医疗系统的 29 个门诊肿瘤诊所接受评估。
由于诊所的随机化顺序,常规护理期白血病患者较多,干预期骨髓瘤患者较多;不过,在其他基线人口统计学特征方面,两组相似。3 个医疗系统患者的死亡率分别为:医疗系统 A 为 26.2%(5570 人中 1461 人死亡),医疗系统 B 为 33.7%(4587 人中 1548 人死亡),医疗系统 C 为 13.4%(7167 人中 959 人死亡)。
- 干预实施情况:3 个医疗系统(A、B 和 C)在每个诊所开始干预时,都对肿瘤医生和高级执业临床医生进行了沟通技能培训。医疗系统 A 的 63 名符合条件的人员全部接受了培训(100%),医疗系统 B 的 60 名中有 53 名接受了培训(88.3%),医疗系统 C 的 91 名中有 59 名接受了培训(64.8%)。在患者视频决策辅助工具使用方面,医疗系统 A 有 516 次观看记录,医疗系统 B 有 2564 次,医疗系统 C 有 4561 次。
- 研究结果:干预阶段有 ACP 记录的患者比例显著高于常规护理阶段(15754 名患者中有 3980 名,占 25.3%;13603 名患者中有 2834 名,占 20.8%;调整后的率差为 6.8%,95% 置信区间为 2.8% - 10.8%,P < 0.001 )。干预阶段关于治疗目标的记录对话比例也高于常规护理阶段(15754 名患者中有 3377 名,占 21.4%;13603 名患者中有 2281 名,占 16.8%;P < 0.001 )。然而,在姑息治疗(干预阶段 15754 名患者中有 1517 名,占 9.6%;常规护理阶段 13603 名患者中有 1287 名,占 9.5%;P = 0.26 )、临终关怀(干预阶段 15754 名患者中有 847 名,占 5.4%;常规护理阶段 13603 名患者中有 724 名,占 5.3%;P = 0.39 )以及限制维持生命治疗(干预阶段 15754 名患者中有 1128 名,占 7.2%;常规护理阶段 13603 名患者中有 1149 名,占 8.4%;P = 0.80 )方面,干预阶段和常规护理阶段没有显著差异。
在不同亚组中,干预效果在白人和少数种族和民族群体患者之间相似(率差分别为 4.2% 和 4.6%,P = 0.39 ),在男性和女性患者之间也相似(率差均为 4.5%,P = 0.93 )。但在 3 个医疗系统之间,干预效果存在一定差异(率差范围为 - 7.4% 至 11.1%,P = 0.06 ) 。不同癌症诊断类型之间也存在一些异质性(率差范围为 - 5.0% 至 8.6%,P = 0.07 ):肺癌、黑色素瘤、妇科癌症、胃肠道癌症和乳腺癌患者的 ACP 记录率增加超过 5%;肉瘤、胸癌、淋巴瘤、脑癌、内分泌癌和骨髓瘤患者的增加幅度较小,而对其他类型癌症的患者没有明显效果。
讨论
在这项针对老年晚期癌症患者的实用性阶梯楔形随机临床试验中,将患者视频决策辅助工具与临床医生沟通技能培训相结合的干预措施,确实提高了有 ACP 记录的患者比例。不过,该干预措施在 3 个医疗系统中的实施情况存在差异。虽然 3 个系统都大力开展了临床医生沟通技能培训,但视频决策辅助工具的实施情况有所不同。
对于老年晚期癌症患者而言,关于重症疾病的讨论意义重大,有助于肿瘤医生根据患者目标调整治疗方案。在治疗决策过程中,往往存在多种合理选择,且各有利弊,这就需要患者积极参与,表达自身的价值观和偏好,同时也要求临床医生具备引导患者表达的能力。但现实中,很多患者和临床医生之间并没有进行这类讨论。
此前的对照研究表明,价值中立的视频决策辅助工具和临床医生沟通技能培训,单独使用时都能促使医患之间展开这类讨论,并提高 ACP 记录率。本试验在此基础上,将这两种干预措施结合起来,从医疗系统层面证明了这种结合能改善晚期癌症患者的 ACP 记录情况。虽然干预措施带来的绝对效果增幅相对较小(调整后的估计率效应为 7%),但从整体人群来看,ACP 记录率的增加在临床和统计上都具有重要意义。而且,这种干预措施具有良好的可扩展性。
整个研究期间都处于 COVID-19 大流行时期,老年重症患者的死亡风险增加,治疗目标讨论变得尤为关键。本试验采用了一种互补的综合方法,通过提供面向患者的视频决策辅助工具,提高患者的认知,同时开展临床医生沟通技能培训,让临床医生有能力、有意愿开启并顺利进行这类敏感话题的讨论。尽管在大流行期间,3 个医疗系统的临床运营都面临巨大挑战,比如临床医生有时会被抽调,信息技术资源也优先用于紧急事务,医疗服务从面诊转变为远程医疗,这些都改变了医患与医疗系统的互动方式以及 ACP 相关敏感话题的沟通模式,但该综合干预措施依然有效,随着时间推移,相比对照期,干预措施显著提高了 ACP 记录率。
即便实施了干预措施,ACP 记录率仍然较低,不过研究中患者的死亡率也低于预期。老年晚期癌症患者在治疗过程中常常面临复杂的、需要根据个人偏好做出的决策。未来可能需要进一步研究那些在疾病发展后期面临更紧迫、更关键决策的患者。
在大型实用性试验中实施多组件干预措施颇具挑战,本试验也不例外。本干预措施的核心在于通过视频决策辅助工具,鼓励患者在就诊前或就诊过程中思考自己的治疗目标,进而促使患者主动与临床医生探讨这些敏感话题,而临床医生经过培训,具备相应技能和清晰的沟通框架来参与这些讨论。如果仅仅从接受沟通技能培训的临床医生比例和患者使用视频决策辅助工具的数量来衡量干预效果,就过于简单化了,因为这忽略了综合干预系统中的关键要素。然而,干预措施实施效果的差异会给结果解读带来困难。
在本试验中,3 个医疗系统都开展了沟通技能培训,但只有 2 个系统较好地实施了视频决策辅助工具部分。目前尚不清楚这种差异是由通用的实施因素(如领导能力、质量文化)、干预模型的特点、长期趋势(包括大流行的影响),还是这些因素的综合作用导致的。当不同医疗系统在干预措施实施效果上存在较大差异时,对于那些没有完整实施综合干预措施的系统,其结果的解读就会面临挑战。如果医疗系统只实施了复杂干预