FDA哨兵计划中因果推断研究的强化:一项方法学示范项目的成果

《npj Digital Medicine》:Strengthening inferential studies in the FDA Sentinel initiative: results from a methodological demonstration project

【字体: 时间:2025年12月16日 来源:npj Digital Medicine 15.1

编辑推荐:

  本研究针对FDA哨兵系统(Sentinel System)中传统保险索赔数据对某些临床结局(如急性胰腺炎)识别能力不足的问题,开展了一项方法学示范研究。研究人员利用新建立的真实世界证据数据平台(RWE-DE),结合电子健康记录(EHR)与索赔数据,比较了SGLT-2抑制剂(SGLT-2i)与DPP-4抑制剂(DPP-4i)在2型糖尿病患者中的急性胰腺炎风险。结果显示,两组风险无统计学显著差异(HR=0.85, 95% CI: 0.67-1.07)。该研究为哨兵系统未来利用多源数据开展复杂安全性评估提供了概念验证和工作流程范本。

  
在药品上市后的安全监测领域,美国食品药品监督管理局(FDA)的哨兵系统(Sentinel System)扮演着至关重要的角色。这个庞大的系统主要依赖保险索赔数据来监测数亿患者中使用医疗产品的安全性。然而,随着科学问题的日益复杂,单纯依靠索赔数据的局限性也逐渐暴露。一个典型的困境是:当需要精准识别某些临床结局时,仅凭索赔中的诊断代码往往不够可靠。例如,急性胰腺炎在索赔数据中的诊断代码,其阳性预测值(PPV)可能低至55%-66%,这意味着近一半根据代码判定的病例可能并非真正的患者。这种结局的错误分类可能导致研究结果出现偏向无效假设的偏倚,从而掩盖真实的药物风险。
为了解决这一数据瓶颈,FDA建立了真实世界证据数据平台(Real-World Evidence Data Enterprise, RWE-DE),该平台将电子健康记录(EHR)与传统的索赔数据相链接,提供了包含超过2500万患者的更丰富临床信息库。那么,这个新平台能否有效应用于那些在传统哨兵系统中被认为“不可行”的研究?一项聚焦于新型降糖药安全性比较的研究为此提供了绝佳的测试场景。
这项发表在《npj Digital Medicine》上的研究,由Rishi J. Desai等人合作完成,旨在评估钠-葡萄糖协同转运蛋白2抑制剂(SGLT-2i)与二肽基肽酶-4抑制剂(DPP-4i)在2型糖尿病(T2DM)患者中引发急性胰腺炎的相对风险。选择DPP-4i作为对照颇具深意,因为其药品说明书中本身就包含了关于急性胰腺炎的警告,这为敏感性比较提供了基础。研究团队从HealthVerity(2018-2020年)和TriNetX(2013-2024年)两个数据库中筛选出97,119名新使用SGLT-2i或DPP-4i的2型糖尿病患者,开展了一项大规模观察性研究。
为了确保研究的科学严谨性,研究人员采用了“目标试验”(Target Trial)框架(即PRINCIPLED框架)来指导整个研究设计,模拟了一项随机对照试验的关键要素。研究的关键创新在于结局的判定:他们没有依赖可能不准确的索赔诊断代码,而是应用了一个经过验证的、可计算的表型算法(Computable Phenotyping Algorithm)。该算法综合运用了诊断代码、实验室检查结果(如淀粉酶、脂肪酶、甘油三酯),在TriNetX数据中甚至还加入了从临床笔记中通过自然语言处理(NLP)提取的特征。这套方法的阳性预测值(PPV)高达90%以上,显著优于单纯依赖诊断代码。
在数据分析方面,研究团队面临另一个真实世界数据的常见挑战——EHR变量中普遍存在的数据缺失。例如,HbA1c(糖化血红蛋白)在HealthVerity数据中仅有约30%的患者有记录,甘油三酯水平的记录率甚至更低(约20%)。他们使用专门的R软件包(如smdi)对缺失数据的模式和机制进行了系统诊断,结论是数据很可能是随机缺失(MAR)的。在此基础上,他们采用了基于随机森林的多重插补(Multiple Imputation)方法来处理缺失值,创建了20个插补数据集。针对混杂偏倚,研究使用了倾向评分(Propensity Score, PS)精细分层加权(Fine Stratification Weighting)的方法,对超过135个基线变量(包括 demographics, comorbidities, medications, 以及来自EHR的实验室结果和生命体征)进行了调整,以模拟随机化分组的效果。分析分别估计了意向治疗(ITT)效应和按方案(PP)效应。
研究队列
最终分析队列包括来自HealthVerity的72,429名患者(SGLT-2i组30,174人;DPP-4i组42,155人)和来自TriNetX的24,690名患者(SGLT-2i组11,943人;DPP-4i组12,747人)。基线特征显示,SGLT-2i组患者平均年龄更小,但在健康总体指标(如CFI和CCI)方面,两组在不同数据源中基本可比。值得注意的是,在TriNetX数据中,SGLT-2i组患者的心肌梗死、稳定性心绞痛和心力衰竭比例高于DPP-4i组,这可能反映了随着时间推移,在SGLT-2i心血管获益证据积累后,其在心血管风险较高的患者中使用增加的趋势。
结构缺失数据调查
对EHR变量缺失情况的调查证实了预期的单调缺失模式。缺失数据诊断显示,有无缺失数据的患者在已测量变量上存在差异,预测缺失的模型曲线下面积(AUC)较高,尤其是在TriNetX中,这支持了随机缺失(MAR)的机制。此外,在调整了其他测量变量后,缺失指标与急性胰腺炎结局之间未发现显著关联,这在一定程度上排除了非随机缺失(MNAR)的可能性。因此,研究者认为采用多重插补方法是合适的。
急性胰腺炎风险
急性胰腺炎的粗发病率在两组中均较低,约为每1000人年2-3例。未经调整的累积发病率曲线显示,两种药物组在任何数据源和任何随访方案(ITT或PP)下的急性胰腺炎风险均具有可比性。经过倾向评分加权调整混杂因素后,核心分析结果出炉:在结合了EHR增强信息的分析中,与DPP-4i相比,SGLT-2i引发急性胰腺炎的风险比(HR)在ITT分析中为0.85(95%置信区间CI: 0.67-1.07),在PP分析中为0.84(95% CI: 0.58-1.22)。值得注意的是,当仅使用索赔数据进行分析(即仅用诊断代码定义结局并调整索赔变量)时,风险估计更接近无效值(ITT分析合并HR=0.99, 95% CI: 0.84-1.16)。这一发现符合方法学预期:结局的非差异性错误分类通常会导致效应估计偏向无效值。这表明,使用更准确的结局定义有助于减少这种偏倚,可能揭示更真实的效应。
亚组分析和稳健性评价
在所有预设的亚组中(包括按年龄、性别、有无急性胰腺炎风险因素分层),结果均与总体人群的分析结果一致,未发现明显的效应修饰作用。为了检验结果的稳健性,研究者还进行了两项敏感性分析:一是将EHR变量的回顾期从6个月延长至12个月以增加数据捕获,二是将分析限制在基线期至少有3次EHR就诊的“忠诚”患者队列中。这些分析虽然提高了EHR协变量的数据完整性,但并未使主要结果发生有意义的改变。此外,作为阴性对照结局分析,缺血性卒中的风险在两组间没有差异(合并HR=0.97, 95% CI: 0.82-1.14),这为研究设计和分析方法控制混杂偏倚的能力提供了一定的支持。
研究结论与讨论
这项研究的主要贡献在于它前瞻性地展示了在哨兵系统中利用包括保险索赔和EHR在内的多源数据进行复杂因果推断分析的工作流程和关键挑战。首先,它强调了在安全性问题出现时,根据研究目的评估数据适用性的重要性。例如,本研究因需要淀粉酶、脂肪酶等实验室数据来准确识别急性胰腺炎,而选择了规模较小但临床信息更丰富的RWE-DE,而非规模巨大但仅有索赔数据的哨兵分布式数据库(Sentinel Distributed Database)。其次,研究证明了可计算表型算法在精准、可扩展地识别复杂结局方面的价值。最后,研究系统性地应对了EHR数据中普遍存在的缺失值问题,并展示了哨兵系统开发的可用分析工具(如处理缺失数据的smdi R包)在常规分析工作流中的高效应用。
在本研究的具体应用场景下,通过对FDA哨兵RWE-DE商业网络中超过97,000名患者的大型研究,未发现SGLT-2i相较于DPP-4i会显著增加或降低2型糖尿病患者急性胰腺炎风险的证据。研究结果在两个独立的数据源和各种亚组中表现一致。然而,研究者也谨慎地指出,由于急性胰腺炎本身是罕见事件,本研究可能缺乏足够的统计学效力来检测出微小的风险差异。因此,“无差异”的结论应理解为在此样本量下未观察到显著风险,而非确定性的等效性。
当然,作为一项观察性研究,它也存在固有的局限性。尽管调整了大量协变量,但由未测量因素或治疗决策中的非随机因素导致的残余混杂仍然可能存在。EHR数据虽然提供了更丰富的临床信息用于混杂控制,但其自身的不完整性(如甘油三酯等重要风险因子记录率低)也可能引入偏倚。此外,RWE-DE在获得更丰富数据的同时,其总人口规模远小于纯索赔网络,这在研究罕见不良事件时可能导致精确度不足。最后,已验证的表型算法在不同数据源中的应用性能可能存在差异,但在像哨兵这样的大型国家监测项目中,为每个新数据源单独验证算法往往不现实。
综上所述,本研究在FDA哨兵RWE-DE商业网络中的成功完成,为未来在该系统中开展需要EHR数据的基于方案的安全性评估提供了重要的概念验证。哨兵系统开发的分析流程和软件包,为利用索赔-EHR链接数据资产进行可扩展、及时且严谨的复杂分析提供了关键的基础构件。随着真实世界数据源的不断扩展和分析方法的持续精进,这类研究将有望更快速、更可靠地回答日益复杂的药品安全问题,最终更好地保障公众用药安全。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号