FDA不良事件报告系统(FAERS)中重复报告的评估:特征分析与公共卫生监测启示

【字体: 时间:2025年06月05日 来源:Drug Safety 4

编辑推荐:

  这篇综述系统评估了FDA不良事件报告系统(FAERS)中重复报告的特征及其对公共卫生监测的影响。研究通过人工审核2297份报告,发现12%为重复报告,其多源于国外监管数据库(如EudraVigilance)或医学文献,且与医疗专业人员(HCP)提交显著相关。研究采用自然语言处理(NLP)技术(如SBERT余弦相似度分析)揭示重复报告间叙事文本高度相似(中位数0.74 vs 非重复0.38),但结构化字段(如年龄、性别、MedDRA? 术语)一致性仅16%。这些发现为优化重复报告预防与检测策略提供了关键数据支持。

  

引言
FDA不良事件报告系统(FAERS)作为药物安全监测的核心平台,长期面临重复报告的挑战。重复报告定义为同一患者在同一时间点使用相同上市产品后发生的相同不良事件的多次报告。这类报告可能源于多方提交(如患者与医生分别报告)、跨国监管数据共享或文献二次引用,不仅增加管理负担,更可能扭曲安全信号检测——既可能产生假阳性信号,又因背景病例数虚增导致假阴性风险。

方法
研究团队从2020年完成的12项药物警戒(PV)综述中抽取2297份报告,通过人工判读分为非重复组(2025份)和重复组(272份,含85组重复集)。分析涵盖结构化字段(报告类型、国家来源、MedDRA?
PTs编码等)与非结构化叙事文本。创新性采用Sentence-BERT模型计算叙事文本余弦相似度,并对比重复组与非重复组的分布差异。

结果
重复报告呈现三大特征:

  1. 来源特征:85%为国外报告(vs 非重复组51%),44%关联其他监管数据库(如加拿大Vigilance),28%源自医学文献。
  2. 提交者特征:89%由医疗专业人员(HCP)提交(vs 非重复组74%),且95%涉及严重结局(但与非重复组88%无统计学差异)。
  3. 数据一致性:年龄、性别等基础字段一致性较高(76%-89%),但关键药物安全字段如可疑产品、伴随用药和MedDRA?
    PTs的一致性骤降,仅16%重复集实现全字段一致。叙事文本相似度则显著区分重复与非重复组(中位数0.74 vs 0.38)。

讨论
研究发现揭示了监管体系固有矛盾:跨国数据共享虽提升信号捕获能力,却加剧重复报告风险。例如,EMA要求企业监测EudraVigilance数据并报告新信号,可能导致同一病例被多国监管机构重复收录。技术层面,SBERT模型展现强大叙事匹配能力,但需解决计算效率问题——当前FAERS日均报告量使全库 pairwise比对难以实现。

创新与局限
研究首次系统量化了叙事文本相似度在重复检测中的价值,并提出结构化字段预处理(如从叙事补充缺失年龄)可提升匹配精度。但样本局限于特定药物事件组合,且未评估差异叙事内容的临床意义。

结论
在缺乏全球唯一报告标识符的现状下,结合NLP技术与监管协同是解决重复报告难题的关键路径。未来需探索混合方法(如相似度阈值+人工复核)在真实世界数据库中的应用,同时推动ICH E2D(R1)关于文献引用格式的标准化以减少文献源性重复。

(注:全文严格依据原文数据,未添加非文献支持内容;专业术语如MedDRA?
、SBERT等均按原文格式标注;数值比较均引用原文统计结果)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号