因果推断工具提升药物警戒:利用有向无环图识别和解决不成比例分析中的偏倚
《Drug Safety》:Causal Inference Tools for Pharmacovigilance: Using Causal Graphs to Identify and Address Biases in Disproportionality Analysis
【字体:
大
中
小
】
时间:2025年12月13日
来源:Drug Safety 3.8
编辑推荐:
本研究针对药物警戒中不成比例分析(DPA)易受混杂、碰撞、测量和报告偏倚影响而难以推断因果关系的难题,提出了一种基于有向无环图(DAGs)的因果推断框架。研究人员通过FDA不良事件报告系统(FAERS)案例研究,演示如何利用DAGs形式化因果假设、优化分析设计、提高信号检测的敏感性和特异性。该研究为将DPA结果更可靠地整合入证据合成流程提供了方法论支持,推动了药物警戒向更严谨的因果推理发展。
在药物安全监测领域,科学家们一直面临着一个核心挑战:如何从海量的自发报告数据中,准确识别出真正的药物不良反应信号?每天,全球的医疗机构和制药公司都会向监管机构提交成千上万份可疑的不良药物反应报告。这些数据宝库蕴藏着发现新药风险的潜力,但同时也充满了陷阱。传统的分析方法——不成比例分析——通过统计药物与不良事件的共报告率是否超出预期来生成安全信号。然而,这种关联性远不等于因果关系。就像发现冰淇淋销量与溺水事件增加相关,并不意味着冰淇淋会导致溺水(更可能的原因是炎热的天气同时促进了这两者),药物与事件的统计关联也常常被各种偏倚所扭曲。过度解读这些关联可能导致不必要的药品恐慌,而忽视它们又可能错过真正的安全警告。这种两难境地呼唤更严谨的工具来弥合“关联”与“因果”之间的鸿沟。
为此,发表在《Drug Safety》上的这项研究引入了一套强大的因果推理工具——有向无环图,旨在为药物警戒中的不成比例分析带来前所未有的清晰度和严谨性。
研究人员开展这项研究,主要运用了几个关键技术方法:首先是构建有向无环图来形式化因果假设和识别偏倚;其次是以信息成分作为不成比例性度量指标,并利用限制法进行条件调整;第三是使用美国FDA不良事件报告系统2004年1月至2023年3月的数据进行案例研究;最后通过森林图比较不同条件设置下的分析结果,验证DAGs指导下的分析策略对偏倚的校正效果。
3.1 DAGs探索简单场景
研究首先从最简单的因果假设入手,展示了DAGs如何描绘药物(D)直接导致事件(E)的因果关系。在理想情况下(无限样本、无偏倚),统计关联可以暗示因果联系。然而,DAGs清晰地揭示,即使在这种简化场景中,统计关联也无法区分直接因果(D引起E)和反向因果(E导致使用D)。这凸显了依赖领域知识(如药物是用于治疗该事件还是可能引起该事件)的重要性。
3.2 DAGs探索复杂场景
随着模型变得复杂,DAGs的优势愈发明显。研究引入了关键概念来解析复杂的因果关系:
- •前门路径:代表药物通过中介变量(M)影响事件的间接因果路径。
- •后门路径:由混杂因子(C)引起,它是药物和事件的共同原因,即使D和E之间没有直接因果关系,也会导致虚假关联。
- •碰撞点:当药物和事件共同影响另一个变量(F)时形成, conditioning on F会引入偏倚。
- •
研究进一步引入了D-分离准则,作为判断在何种条件下统计关联能反映因果关系的规则。通过“签署DAGs”(假设因果关系是单调且同质的),研究者甚至可以预测偏倚的方向(正偏倚导致假阳性,负偏倚导致假阴性)。
3.3 形式化不同类型的偏倚及案例
3.3.1 混杂偏倚
研究通过多个FAERS实例展示了如何用DAGs识别和校正常见的混杂偏倚。
- •适应症混杂:氟哌啶醇与冲动性的关联,在限制于记录有精神分裂症(氟哌啶醇的适应症,也是冲动性的原因)的报告后消失,表明原关联是虚假的。
- •合并用药混杂:氢氯噻嗪与发声困难的关联,在限制于同时记录缬沙坦(已知引起咳嗽相关发声困难)的报告后消失。
- •禁忌症混杂(负混杂):纳武利尤单抗与早产的关联在总体分析中为负,但限制于妊娠患者报告后变为正,揭示了因妊娠(纳武利尤单抗的部分禁忌症)导致药物使用减少而掩盖的真实风险。
- •性别混杂:曲妥珠单抗与前列腺癌的关联在总体分析中为负(因药物主要用于女性),在限制于男性报告后关联性增强。
3.3.2 形式化碰撞偏倚
- •正碰撞偏倚:CAR-T疗法与感染的关联,在限制于致命报告时增强,因为CAR-T提高生存率(降低死亡),而感染增加死亡风险,条件调整于死亡这个碰撞点打开了虚假关联的路径。
- •负碰撞偏倚:阿司匹林与胃溃疡的已知关联,在限制于使用质子泵抑制剂(既预防阿司匹林相关溃疡,也治疗现有溃疡)的报告时减弱,因为碰撞偏倚掩盖了真实信号。
3.3.3 形式化测量误差
研究强调,在实际分析中,我们只能观察到变量测量值(D, E),而非真实构念。测量不完整或错误会引入噪声。例如,在考察顺铂与血栓形成的关系时,癌症是潜在的混杂因子。仅条件调整于“癌症适应症”或“合用抗肿瘤药”会因信息缺失导致样本量过小。解决方案是创建一个复合测量(满足任一条件即可),以更有效地控制混杂。
确定偏倚是另一种测量误差,即药物暴露本身增加了事件被检测和报告的机会。例如,氯氮平因粒细胞缺乏风险需频繁验血,从而增加了高钾血症的检测和报告几率。在限制于记录有任何实验室检查的报告后,氯氮平与高钾血症的关联度(IC)下降,更接近真实情况。
3.3.4 形式化报告偏倚
报告过程本身是药物警戒数据特有的偏倚来源。一个报告要产生,至少需要一种可疑药物和一种事件被报告(Rd和Re)。这本身就引入了选择偏倚。此外,外部因素如媒体关注、监管警告等会影响报告行为。
- •知名度偏倚:监管警告或媒体报道会提高特定药-事件组合的报告率,导致假阳性信号。
- •掩蔽效应:其他药物(药物竞争偏倚)或其它事件(事件竞争偏倚)的报告率增加,会稀释目标药-事件组合的信号强度,导致假阴性。例如,卡利拉嗪与赌博的关联在移除其他多巴胺激动剂的报告后增强。
- •背景稀释:大量与目标药-事件无关的报告涌入数据库(如COVID-19疫苗报告激增),可能会意外地增强其他不相关药-事件组合的关联信号。
3.4 在复杂场景中系统使用DAGs的工作流程
研究以阿立哌唑诱发冲动控制障碍这一已知不良反应为例,展示了一个系统应用DAGs的完整工作流程:
- 1.
- 2.构建知识驱动DAG:考虑反向因果(可能性小)、混杂(如双相情感障碍)、碰撞点(未识别)、测量变量(使用MedDRA术语,锂盐作为双相情感的替代指标)、报告偏倚(2016年FDA警告引起的知名度偏倚,多巴胺激动剂引起的掩蔽效应)。
- 3.签署DAG:假设双相情感障碍增加阿立哌唑使用和冲动控制障碍风险(正号)。
- 4.指导分析设计:通过条件调整控制混杂(限制于有双相情感障碍或锂盐使用的报告)、避免碰撞偏倚(不限制于多巴胺激动剂)、校正报告偏倚(限制于FDA警告前的报告,移除竞争性多巴胺激动剂报告)。
- 5.运行敏感性分析并比较:森林图显示,在校正了上述偏倚后,阿立哌唑与冲动控制障碍的正关联仍然存在且方向符合预期,增强了因果关系的可信度。
4 讨论与结论
本研究系统地论证了有向无环图如何为药物警戒中的不成比例分析提供一个结构化的因果推理框架。DAGs通过将研究者的因果假设和现有知识形式化,使得分析设计的理由更加透明,能够识别和指导校正各类偏倚(混杂、碰撞、测量、报告),从而提升所产生安全信号的可靠性。尽管DAGs本身不能从自发报告数据中“证明”因果关系,并且其有效性依赖于DAG本身设定的准确性,但它们极大地帮助厘清了从关联推断因果所需的条件,明确了残留的不确定性,并指导后续需要哪些证据(如流行病学研究)来进行三角验证。
这项研究的意义在于,它推动药物警戒从单纯的数据挖掘转向基于知识的因果探索。它鼓励研究人员明确其假设,使分析过程更容易被审查和批评,从而促进科学知识的集体迭代发展。通过弥合关联与因果之间的部分鸿沟,DAGs有助于生成更可靠的安全信号,优化监管资源的分配,并最终更好地保护患者免受药物相关伤害。未来研究应致力于进一步完善DAGs在药物警戒中的应用,包括更好地映射数据生成过程、整合纵向信息以及开发半自动化工具来辅助这一过程。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号