《Naunyn-Schmiedeberg's Archives of Pharmacology》:Quarterly persistence as a signal prioritization framework in FAERS: an analysis of the 2025 public-use releases
为开发和应用针对202 Motivated by the need to develop and apply a quarterly pharmacovigilance workflow for the 2025 FDA Adverse Event Reporting System (FAERS) public-use XML releases, with emphasis on temporal persistence, cohort sensitivity, and prioritization-oriented signal characterization. The raw input consisted of 12 quarterly FAERS XML files (approximately 8.58 GB), which were parsed into report-level drug-reaction pairs using a chunked workflow. The main analysis used a PS-clinical cohort including primary suspect drugs from serious reports, whereas a sensitivity analysis expanded this definition to a PS+SS-clinical cohort by including secondary suspect drugs. Quarterly product-reaction pairs were screened using a disproportionality rule requiring n11 ≥ 3, proportional reporting ratio (PRR) ≥ 2, χ2 ≥ 4, and a lower 95% confidence bound of the reporting odds ratio (ROR) greater than 1. A more conservative subset was defined by n11 ≥ 10, followed by post-screening refinement for temporal comparison. Under the PS-clinical cohort, the quarterly retained sets ranged from 41,897 to 47,220 pairs, and the annual union contained 82,565 unique retained pairs. Of these, 18,629 (22.56%) were detected in all four quarters. Pairwise Jaccard similarities ranged from 0.4027 to 0.4845, indicating moderate but structured temporal continuity, with the strongest overlap between Q3 and Q4. Fully persistent 4/4 pairs showed higher support counts and larger mean χ2 values than quarter-specific 1/4 pairs, whereas mean PRR did not differ materially between these groups. Within the 4/4 core, most pairs were relatively stable over time, while only a small subset showed marked temporal imbalance. Expansion to the PS+SS-clinical cohort substantially increased both the retained signal space and the 4/4 core, while leaving the overall temporal overlap pattern broadly similar. Quarterly persistence may provide an additional and interpretable dimension for internal FAERS-based signal characterization and prioritization. Rather than replacing disproportionality metrics, it may complement them by highlighting reproducibility, continuity, and temporal structure across quarterly retained signal sets. External validation against independent pharmacovigilance reference standards remains an important direction for future work.
## 研究背景与问题
自发报告系统(spontaneous reportingREWsystem, SRS)在上市后药物警戒(pharmacovigilance)中发挥着核心作用,能够在真实世界条件下实现大规模的信号检测,往往在更正式的流行病学证据出现之前即可提供预警。其中,美国食品药品监督管理局不良事件报告系统(FDA Adverse Event Reporting System, FAERS)因其规模庞大、公开可获取以及在信号检测实践中的广泛应用而尤为重要。在该系统中,比例报告比(proportional reporting ratio, PRR)、报告比值比(reporting odds ratio, ROR)、Chi
2统计量、信息成分(information component, IC)以及经验贝叶斯(empirical Bayesian)方法等不均衡性分析方法已成为识别药物-反应组合的标准工具。
然而,源自自发报告系统的信号需要谨慎解读。FAERS数据存在诸多已知局限性,包括漏报、 stimulated reporting、数据质量参差不齐、重复提交、产品 utilization变化以及缺乏暴露分母等。因此,不均衡性分析更适合被视为信号产生工具而非因果推断工具。尽管如此,在透明的分析流程、敏感性分析及临床可解读的后筛选策略框架下,这些方法在优先级排序方面仍具有重要价值。
在实际应用中,不均衡性研究常以横断面快照形式呈现,而FAERS按季度更新。这种季度结构为考察信号检测能力随时间的变化提供了机会:仅在单个季度中出现的药物-反应组合可能反映短暂模式,而在多个季度中反复检测到的组合则可能指示更具可重复性的报告信号,值得进一步关注。尽管药物警戒文献已对信号检测方法学及自发报告系统的优势与局限性提供了大量指导,但对于季度发布之间的持续性、保留信号集之间的两两重叠以及 successive public data updates中的重复可检测性关注较少。
此外,保留信号集的规模受多种分析决策影响,包括XML解析策略、重复数据处理、药物角色选择、严重性筛选、不均衡性阈值及后筛选精化等。比较方法学研究表明,信号检测结果可能因算法、数据库和分析定义而异。在此背景下,分析设置之间的差异不应仅被视为分歧,它们还可提供关于稳健性和可重复性的信息。因此,季度药物警戒工作流程不仅应在单次发布内对信号进行排序,还应刻画时间重叠、持续性类别以及结论对队列定义合理变化的敏感性。
研究人员采用2025年全部FAERS公开使用XML文件开展研究,旨在解决以下问题:实现将原始XML文件转换为报告级药物-反应对的内存高效工作流程;定义主要PS-clinical队列并在统计筛选和后筛选精化后推导季度保留信号集;通过1/4、2/4、3/4和4/4类别量化年度持续性;在更广泛的PS+SS-clinical队列下评估敏感性;以及从支持度、时间变异性和简要定性回顾方面刻画持续性4/4核心。
该研究的目的并非声称临床因果性,而是提供一种可解读的时间信号优先级框架。研究聚焦于持续性、重叠、稳定性和敏感性作为药物警戒评估的补充维度。在此视角下,季度保留信号集不应仅被视为孤立的不均衡性输出,而应被理解为具有时间结构的分析对象。季度持续性进而可提供额外且实用的层次,用以区分季度特异性关联、可重复的年度核心以及更广泛FAERS报告景观中持续但不均衡表达的信号。该论文发表在《Naunyn-Schmiedeberg's Archives of Pharmacology》。
## 关键技术方法
研究人员采用的技术方法主要包括:基于分块策略的内存高效XML解析,将12个季度性FAERS XML文件(约8.58 GB)转换为报告级药物-反应对;定义PS-clinical队列(主要嫌疑药物+严重报告)和PS+SS-clinical敏感性队列(含次要嫌疑药物);应用标准不均衡性筛选规则(n
11≥3、PRR≥2、χ
2≥4、ROR的95%置信下限>1)及保守子集(n
11≥10);实施基于语义类别的两步骤后筛选精化;通过Jaccard相似系数和绝对交集计算季度重叠;按1/4至4/4类别定义年度持续性;采用Mann-Whitney检验比较持续性与季度特异性信号;以max(n
11)/min(n
11)比值和变异系数评估4/4核心内稳定性;并进行保守的跨季度重复报告去重敏感性分析。
## 研究结果
**PS-clinical队列下的季度汇总**
在主要PS-clinical队列下,各季度评估的药物-反应对数量范围为700,560至772,205。n
11≥10的稳健信号数量为45,494至51,134。经后筛选精化后,最终保留集为41,897至47,220对。第三季度产生最大的保留季度集,但全年整体规模保持相对稳定。
**年度持续性结构与4/4核心**
四个季度保留集的年度并集包含82,565个独特的药物-反应对。其中,34,739(42.07%)仅出现在一个季度,16,782(20.33%)出现在两个季度,12,415(15.04%)出现在三个季度,18,629(22.56%)出现在所有四个季度。尽管最大比例的保留信号为季度特异性,但近四分之一的年度并集形成了持续性的4/4核心。代表性强信号包括VEDOLIZUMAB-Haematochezia(持续检测且季度支持相对平衡)、OZEMPIC-Impaired gastric emptying以及SPRAVATO-Dissociation(持续性与更显著的时间不平衡并存)。
**季度保留集的重叠**
季度重叠分析显示PS-clinical保留集中存在适度但结构化的时间连续性。两两Jaccard相似性为0.4027至0.4845,表明季度保留集既非完全相同也非完全不相交。Q3与Q4之间的重叠最强,Q1与Q4之间的重叠最弱。绝对交集呈现相似模式:Q3和Q4共享30,270个保留对,而Q1和Q2共享27,354个,Q1和Q4共享26,109个。相邻季度倾向于比较远季度共享更大的共同核心。
**队列定义的敏感性:PS与PS+SS的比较**
将队列从PS-clinical扩展至PS+SS-clinical显著增加了每季度的保留信号空间规模。季度保留集从PS-clinical下的41,897-47,220对增加至PS+SS-clinical下的66,978-73,927对,相对增幅为51.81%-59.86%。尽管规模扩大,PS与PS+SS保留集之间的重叠仍保持适度一致,季度Jaccard相似性为0.5166-0.5473。更广泛的PS+SS-clinical队列保留了PS-clinical中观察到的相同一般重叠几何结构,最强连续性仍出现在Q3与Q4之间。年度层面上,持续性4/4核心从PS-clinical下的18,629对增加至PS+SS-clinical下的29,699对。两个4/4核心之间的交集为15,959对,Jaccard相似性为0.493。扩大队列显著改变了保留信号空间的规模,但对其时间结构影响甚小。两种队列定义下1/4至4/4持续性类别的比例分布保持高度相似。
**季度特异性信号与完全持续性信号的比较**
为评估年度持续性是否与更强的统计支持相关,研究人员比较了仅在一个季度观察到的保留对(1/4)与在所有四个季度观察到的保留对(4/4)。完全持续性对具有显著更高的平均支持计数,中位平均n
11为23.75,而季度特异性对为12.00(Mann-Whitney U=99,826,101,p<10
-16)。类似地,4/4对显示出更强的总体χ
2证据,中位数为157.19,而1/4对为90.65(U=262,906,202,p=4.35×10
-280)。与之对比,两组之间的平均PRR无实质性差异(4/4中位数7.93 vs 1/4中位数8.88;U=324,545,614,p=0.568)。总体而言,年度持续性与保留信号空间内较大的支持计数和更强的统计证据相关,但与持续更大的PRR值无关。
**4/4核心内的稳定性与高度变异性信号**
季度的存在并不意味着报告强度均匀。在年度4/4核心内,大多数保留对显示季度支持相对平衡,而较小部分表现出显著的时间不平衡。使用max(n
11)/min(n
11)比值,10,991对被分类为稳定(≤2),150对被分类为高度变异(≥5)。尽管数量较少,高度变异对具有大得多的支持度:其中位总n
11为171.0,而稳定组为86.0;中位平均n
11为42.75,而稳定组为21.50。预期之中,高度变异对也显示出更大的时间变异,中位max/min比值为5.92(稳定组1.60),中位变异系数为0.755(稳定组0.209)。这些结果表明,4/4核心由相对稳定的关联主导,仅小部分显示出强但不均匀的季度强度。
**代表性持续性信号的探索性定性回顾**
为补充4/4核心的定量分类,研究人员对前25个稳定对和前25个高度变异对进行了探索性定性回顾。在此临时注释下,高度变异对并未系统性显得较不可信。在回顾样本中,72%的高度变异对被归类为临床合理,而稳定对为60%;64%的高度变异对被注释为已知或预期,而稳定对为56%。临时保留标签赋予40%的高度变异对和28%的稳定对,而可能人为标签赋予20%和28%。这些探索性结果表明,时间变异性本身并不意味着较低的可信度。一些高度变异的持续性对可能仍代表具有临床意义的关联,尽管其报告强度随时间变化显著。稳定性和可信度应被视为相关但不同的维度。
**跨季度重复报告的敏感性**
由于FAERS季度公开使用版本可能包含 successive extracts中同一案例的重复出现,研究人员进行了额外的敏感性分析以评估跨季度重复报告对PS-clinical队列时间结构的潜在影响。在季度聚合为药物-反应列联表之前的案例层面,识别出85,112个在多个季度出现的safetyreportid值。其中,47,839个在季度出现之间具有相同的药物-反应对集,被视为可能的结转重复;其余则被保留为可能更新的案例版本。从相同重复案例中去除重复对消除了880,638行,占PS-clinical队列的3.70%。最大减少发生在Q1和Q2,Q3减小较少,Q4无变化。在重建季度对级别支持度后,n
11≥10的对数从Q1的103,688减少至97,849,Q2从95,209减少至90,978,Q3从112,881减少至110,755,Q4同样无变化。因此,跨季度相同重复案例的结转确实在一定程度上膨胀了预聚合支持计数,尤其在较早季度,但在此保守去重规则下该效应幅度为中等。
## 讨论与结论总结
研究结果表明,季度FAERS信号检测可被视为具有时间结构的过程,而非孤立不均衡性快照的序列。在主要PS-clinical队列下,保留季度集规模庞大但全年相对稳定,既产生了实质性的年度并集,也形成了持续的4/4核心。同时,重叠分析显示适度连续性而非完全稳定或随机更替,相邻季度比较远季度共享更多保留对。这些结果表明,季度FAERS分析更适合被理解为相关的时间信号集,而非独立的季度输出。
季度特异性(1/4)与完全持续性(4/4)信号的比较进一步支持这一解读。完全持续性对显示出更大的支持计数和更强的总体χ
2证据,而两组间平均PRR无实质性差异。这种模式表明,季度持续性与重复经验支持和累积统计稳定性的关系更为密切,而非系统性更大的相对不均衡性。在此意义上,持续性可能增添与标准不均衡性指标互补而非冗余的信息。重复季度检测似乎识别了那些在发布之间保持分析可重复性的对,即使其相对不均衡性并非始终更高。
敏感性分析提供了额外支持。纳入次要嫌疑药物显著扩展了保留信号空间并扩大了年度4/4核心,但对总体持续性特征和重叠几何结构影响甚小。最强连续性仍出现在相邻季度,尤其是Q3和Q4。这表明保留信号空间的时间组织并非仅由更严格的主要嫌疑定义的产物。
PS-clinical队列中跨季度重复报告的额外方法学敏感性分析显示,重复safetyreportid值在季度发布中被观察到,部分在季度之间显示相同的药物-反应对集。在此保守去重规则下,最大效应出现在Q1和Q2,Q3效应较小,Q4无效应。同时,重建的季度对级别支持计数变化幅度保持中等。这表明重复案例结转可在一定程度上膨胀时间汇总,尤其在较早季度,但本身并不能完全解释主要分析中观察到的更广泛时间结构。
4/4核心内稳定性与高度变异性成员的区分添加了额外的描述层次。所有四个季度的存在并不意味着季度支持均匀。大多数持续性对季度间相对平衡,而更小部分将持续性与显著时间不平衡相结合。此类高度变异的持续性对可能反映暴露变化、报告实践、产品使用、外部关注或更广泛的报告行为转变。从实践角度,区分稳定持续性与峰值驱动持续性可能有助于在持续性核心内细化药物警戒优先级。
探索性定性回顾提供了进一步的警示视角。在回顾子集中,高度变异持续性对未系统性显得较稳定持续性对更不可信。这表明时间不平衡本身不应被视为相关性较低的证据。同时,定性回顾也强调了解释指征样首选术语、非特异性临床语言和情境敏感报告类别时需谨慎。因此,该定性成分应被解释为探索性信号表征而非验证。
重要限定在于,该研究仅将持续性评估为保留FAERS信号集的内部属性。因此,研究结果支持季度持续性作为基于FAERS信号检测中可解读的分析和优先级导向维度,但并未确立持续性对更可能对应于外部确认或随后验证的安全性信号。证明这种更强形式的优先级效用需要与外部参考标准进行比较。
总体而言,研究结果支持季度持续性作为基于FAERS的内部信号表征和优先级的额外可解读维度。持续性可能通过帮助区分季度特异性关联、可重复的年度核心以及持续但不均衡表达的信号来补充不均衡性分析。从方法学角度,这种方法将传统基于快照的药物警戒工作流程朝向更明确的时间描述的保留信号空间扩展。从实践角度,它提供了可解读的框架,用于将大型季度信号集组织为可能支持下情书审查和优先级的可重复时间类别。
研究结论指出:首先,保留季度集显示适度但一致的时间重叠,相邻季度比较远季度共享更大的共同核心,表明保留信号空间全年逐渐变化而非通过突然的季度更替。其次,完全持续性4/4对比季度特异性1/4对显示出更大的支持计数和更强的χ
2证据,而平均PRR两组间无实质性差异,年度持续性在此分析中似乎反映重复经验支持和累积稳定性而非系统性更大的相对不均衡性。第三,持续性4/4核心具有异质性:大多数对季度间相对稳定,而更小部分显示显著时间不平衡。第四,从PS扩展至PS+SS显著扩大了保留信号空间和年度4/4核心,同时基本时间结构基本不变。最后,探索性定性回顾表明时间变异性本身并不意味着较低可信度,因为部分高度变异持续性对从药物警戒角度仍可能具有意义。外部验证仍是未来工作的重要方向。