《Journal of Traumatic Stress》:Artificial intelligence in traumatic stress treatment: The TRUST framework for ethical development, clinical applications, and research advancement
编辑推荐:
创伤后应激障碍(posttraumatic stress disorder, PTSD)与抑郁是在创伤事件后常见的诊断结果,且已有多种循证干预可用于减轻症状学表现。然而,创伤人群面临显著的可及性障碍,限制了这些干预的采纳与覆盖范围。人工智能(artificia
创伤后应激障碍(posttraumatic stress disorder, PTSD)与抑郁是在创伤事件后常见的诊断结果,且已有多种循证干预可用于减轻症状学表现。然而,创伤人群面临显著的可及性障碍,限制了这些干预的采纳与覆盖范围。人工智能(artificial intelligence, AI)技术,如大语言模型(large language models, LLMs),有潜力提升创伤应激干预的可及性、成本效益、实施方式与服务质量。其在创伤应激治疗与研究中的应用仍研究不足,需要通过负责任且符合伦理的开发、评估与监测,以维持针对创伤幸存者及其服务提供者的服务质量与服务交付。本文提出了关于负责任使用 AI 工具以合乎伦理地塑造创伤聚焦治疗与研究的若干考量,并通过未来使用场景突出这些关键问题。创伤导向 LLM 开发需要采取多学科路径,整合创伤专家、临床医生与创伤幸存者的反馈和评估,并优先保障创伤聚焦照护的质量、安全性、有效性与公平性,这一点至关重要。本文提出 TRUST 框架,该框架借鉴了相邻精神卫生 AI 应用的证据以及数字化创伤干预的新兴研究,同时承认创伤特异性 AI 试验数据仍然有限。上述议题已在国际创伤应激研究学会第 41 届年会上由 AI 技术专家专题小组进行报告,旨在支持创伤聚焦干预。
文章围绕人工智能(AI)尤其是大语言模型(LLMs)在创伤应激治疗中的伦理开发、临床嵌入与研究推进展开论述,核心目标是提出一个兼顾安全性、有效性、公平性与可实施性的创伤导向框架。作者指出,创伤后应激障碍(PTSD)与抑郁在创伤暴露后高度常见,尽管认知加工治疗(CPT)、延长暴露(PE)、书面暴露治疗(WET)以及创伤聚焦认知行为治疗(TF-CBT)等循证方法已被证实有效,但现实中仍受制于污名、经济压力、交通障碍、资源认知不足及治疗者短缺等因素,导致服务可及性不足。基于此,LLMs 被视为可能改善服务覆盖、降低成本并优化治疗流程的技术路径,但其在创伤领域仍缺乏充足临床试验支持,因此当前更适宜被定位为循证启发下的概念框架与研究议程,而非成熟定论。
KEY ETHICAL CONSIDERATIONS OF AI FOR TRAUMA POPULATIONS
在面向创伤人群部署 AI 时,文章首先强调以幸存者自主性与安全性为核心的伦理框架。知情同意必须清晰说明 AI 在临床照护或研究参与中的介入程度,使个体明确了解何时、如何由 AI 处理其数据,以及自动化输出与人工临床干预之间的边界。与此同时,研究人员与临床医生还需持续关注 AI 在精神卫生场景中的州级与联邦层面监管变化。作者特别指出,训练数据若缺乏边缘化群体的代表性叙事,算法偏差便可能导致差异化照护和诊断误差;因此,开发者与临床使用者不仅要重视隐私与数据治理,还需依赖独立验证的安全工具来保证输出在语境上恰当且临床上安全。文章进一步讨论了 AI 的潜在伤害,包括放大既有卫生不平等、输出有害建议、诱发高风险行为,以及因“模型漂移”导致性能下降等问题。为应对这些风险,作者主张从部署前、部署中与部署后三个阶段建立全生命周期治理机制,包括代表性数据训练、分群体偏差审计、越狱测试、危机升级流程、人类在环(human-in-the-loop)监督、实时安全监测、不良事件报告、持续偏差检测与必要时去实施(deimplementation)等。对创伤场景而言,尤其要区分治疗性痛苦与真实危机,避免安全机制过度中断暴露治疗等必要治疗过程。
AUGMENTING CLINICAL DECISION MAKING AND CARE PROCESSES VERSUS REPLACING CLINICIANS
在临床角色定位上,文章明确反对以 AI 替代治疗师,而主张将其作为增强临床决策与照护流程的辅助工具。作者指出,尽管通用生成式 AI 已广泛进入公众心理健康求助场景,但其长期安全性、真实世界有效性及复杂情境判断能力仍不足以支持独立取代临床人员。对于创伤治疗而言,这一点尤为重要,因为许多治疗依赖现场暴露或认知暴露,需要治疗师根据具体环境、患者风险、家庭支持与文化情境进行审慎判断。LLMs 或可用于建议家庭作业式暴露任务、识别创伤叙事中的高痛苦片段,或辅助提出苏格拉底式提问,但是否适合实施、如何控制风险、何时需要调整干预,仍必须由具备专业训练的人类治疗师决定。文章还强调,文化因素深刻影响创伤相关认知、羞耻体验与应对方式,而 LLMs 目前已显示出偏见与误导风险,在文化敏感性、个案概念化及自伤风险综合评估方面均不能替代临床判断。作者因此提出,AI 更适合用于支持个案概念化、危机升级信息摘要、即时干预建议以及高风险患者转介接受度提升等环节,并保留治疗师在关键决策中的主导权。未来研究还应关注跨多轮对话和多次会谈的风险识别,因为临床风险常在纵向互动中逐渐显现,这对训练数据、人工标注和合成数据验证都提出更高要求。
PROMOTING EQUITABLE ACCESS TO TRAUMA TREATMENT
关于公平可及性,文章认为,在安全与公平被优先纳入设计的前提下,LLMs 可能缓解创伤治疗中的结构性障碍。例如,在资源匮乏的农村地区或精神卫生服务不足的社区,AI 可提供心理教育、症状追踪、情绪调节工具以及简短筛查与干预,从而扩大初级保健、急诊部门、学校等场景中的服务入口,并以较低成本覆盖保险不足、日程受限或行动不便者。作者还将污名视为创伤幸存者求助的重要阻力,指出 AI 可能为羞耻感强、担忧被评判的个体提供一个被感知为“非评判性”的初始接触空间,尤其适用于道德创伤等高羞耻情境中的信息披露练习。不过,文中并未夸大这一潜力,而是同时提出聊天机器人能否真正体现共情、是否可能诱发依赖或操控等疑问。文章进一步提出,LLMs 在创伤暴露早期也可承担常态化反应解释、患病率信息告知、污名消解、主动筛查和长期症状监测等功能,并在识别既往创伤史后推荐本地化资源或循证干预。然而,这些推荐必须基于临床相关性而非商业利益。作者还讨论了多语言与方言支持对少数群体可及性的意义,认为语言适配并不等于文化适配,必须依赖具文化专长的母语者与目标社区成员参与验证,才能提升工具的文化可接受性与信任度。
RESPONSIBLY TRAINING LLMS IN TRAUMA-SPECIFIC DATA
在训练层面,作者强调创伤导向 LLMs 不能仅凭通用语料获得安全、有效的治疗能力。由于创伤治疗往往要求持续接触痛苦记忆与相关情感,若模型缺乏创伤特异性数据训练,便可能在“支持用户”的表面目标下无意强化回避行为,从而削弱治疗效果。因此,模型训练应充分体现手册化创伤治疗的结构、技术与互动逻辑,同时把安全、隐私与公平作为底线要求。
Trauma survivor perspectives and acceptability
文章在这一小节中指出,关于创伤幸存者对 LLM 辅助干预偏好与接受度的实证研究仍极为有限,这是必须通过社区参与式研究弥补的关键缺口。作者主张将创伤幸存者、临床医生与创伤专家纳入共同设计过程,系统收集他们对安全与隐私、互动参与度、内容相关性、实施兼容性、可持续性与可扩展性的看法。现有早期数字化创伤治疗研究提示,部分患者认为数字疗法在效果上可接近面对面照护,并可改善可及性、成本效益与资源利用效率;同时,临床人员虽认可数字化治疗的照护质量,但对患者安全仍存顾虑。复杂创伤人群对数字干预的可接受性也已有初步积极信号。作者认为,这些发现为 LLM 支持创伤干预提供了可借鉴基础,但远不能替代大样本创伤特异性研究。作者进一步指出,来自幸存者与内容专家的定性反馈有助于不断修正模型语言、危机升级方案与创伤知情表达方式,但二者输入需保持平衡,因为终端用户偏好并不总与最佳循证实践一致,例如多数幸存者倾向回避创伤叙述,而高效 PTSD 治疗却通常要求直接加工创伤记忆、认知与情感。因而,理想设计应结合用户体验测试、人工反馈、可用性评分、满意度评估与 AI 治疗联盟测量,以兼顾接受度与临床效能。
Research priorities to support LLM training in trauma-specific data
在研究优先事项方面,作者强调创伤导向 LLM 开发需纳入针对危机情境与创伤触发的响应过滤和自动升级机制,但目前如何安全、有效地操作化这些机制仍未解决。与同步远程精神卫生服务不同,异步 AI 工具没有实时治疗者在场,也无法天然保证响应时限,因此研究需明确:模型识别危机后应立即中止对话还是在升级的同时继续提供支持;如何制定基于证据的响应时限标准;如何衔接现有危机基础设施,如 988 危机热线或 911;以及如何建立能够区分治疗性痛苦与真正危机的创伤知情风险评估算法。作者还指出,在临床部署前,创伤导向 LLM 必须接受与适当对照条件的比较,以评估其疗效、有效性、适宜性、安全性、隐私保护以及对 PTSD、抑郁症状与服务可及性的影响。待有效性证据较为充分后,还应评估成本、覆盖范围与忠实性等实施指标。但传统临床试验周期漫长,与 AI 快速迭代节奏不匹配,因此需要采用混合有效性—实施研究、A/B 测试、阶梯楔形设计等更具适应性的评估框架。
OVERVIEW OF FUTURE RESEARCH PRIORITIES TO SUPPORT LLMS FOR TRAUMATIC STRESS INTERVENTIONS
文章随后从更广阔的研究议程层面讨论未来方向。作者认为,尽管 AI 在精神卫生中的应用正在迅速增长,且已有研究尝试将其用于治疗师培训、患者参与促进与 PTSD 治疗支持,但创伤相关障碍涉及事件类型广泛、风险结构复杂,仍需专门研究负责任的开发与部署路径。儿童与青少年创伤人群被特别列为证据缺口,因为这类群体既有较高心理健康需求,也已在现实生活中广泛接触生成式 AI。作者因此强调,若要在学校、儿科医疗之家、儿童创伤中心及社区心理卫生机构中整合 LLMs,必须优先考虑加密、家长同意、潜在监护与保密存储等技术和伦理护栏,并在安全监测前提下吸纳儿童及其可信成人参与设计与评估。此外,文章还将数字素养与 AI 素养视为实现公平可及性的前提条件,建议将 AI 风险、收益、隐私、安全与平台局限性教育,与创伤治疗素养教育一并传播,以帮助创伤幸存者辨识何为有效且安全的服务。作者同时注意到,互联网接入不足会加剧农村地区原有不平等,因此需与网络服务提供方合作,并在农村社区开展创伤导向 LLM 的开发和测试,避免新技术继续只惠及既有优势群体。
INTEGRATED FRAMEWORK FOR RESPONSIBLE TRAUMA-FOCUSED AI DEVELOPMENT
在综合框架部分,作者提出 TRUST,即“创伤知情的安全 AI 技术负责任使用”(Trauma-informed Responsible Use of Safe AI Technologies)框架。该框架综合 AI 伦理、实施科学与创伤知情照护原则,并参考 READI、SHIFT、EBP-AI 等既有框架,将创伤导向 AI 的开发与部署组织为四个连续且相互依赖的迭代阶段,同时贯穿利益相关方持续参与。其核心思想是:以创伤幸存者、临床医生、开发者及领域专家的连续反馈为驱动力,在用户中心设计、透明性、安全优先与责任治理之间建立动态平衡,并据此形成分层研究议程。作者认为,这种协作式、迭代式路径有助于确保创伤导向 AI 并非仅在技术上可行,而是在现实世界中同样具备安全性、公平性、相关性与实施价值。
CONCLUSIONS
文章最后总结认为,尽管 AI 在精神卫生中的发展极为迅速,但迄今尚无专为创伤干预设计的 AI 技术经过足够样本量的临床试验验证。当前仍不清楚此类工具将如何影响治疗联盟、评估准确性、干预效果,以及其能否契合创伤幸存者既独特又多样的需求与偏好。因此,该领域的推进必须依赖审慎的多学科协作,将创伤临床、研究、技术开发与幸存者经验整合起来,并始终把质量、安全与公平置于核心位置。TRUST 框架正是在这一背景下提出,旨在为未来 AI 与 LLMs 支持创伤干预的研究设计、伦理治理与实践部署提供系统指引。