保护患者隐私的表格合成健康数据:监管视角下的风险与对策

《npj Digital Medicine》:Protecting patient privacy in tabular synthetic health data: a regulatory perspective

【字体: 时间:2025年11月29日 来源:npj Digital Medicine 15.1

编辑推荐:

  本文针对表格合成数据生成(SDG)在医疗领域的隐私保护问题,系统分析了英国、新加坡和韩国发布的SDG监管指南。研究发现合成数据并非天生无披露风险,需通过隐私评估才能视为非个人信息,同时强调数据质量与偏见评估的重要性,为合成健康数据的合规使用提供了监管框架。

  
随着人工智能和机器学习技术在医疗领域的广泛应用,表格合成数据生成(Synthetic Tabular Data Generation, SDG)作为一种隐私增强技术(Privacy-Enhancing Technology, PET)正受到越来越多关注。合成数据通过学习真实数据的分布特征来生成人工数据,既能保留原始数据的统计特性,又能降低患者隐私泄露风险。然而,这种技术也引发了新的伦理担忧,特别是关于残余隐私漏洞和监管不足的问题。医疗数据的敏感性、庞大体积和监管复杂性给数据二次使用(如科学研究)带来巨大挑战。研究表明,从研究者获取个体水平数据的成功率普遍较低,从58%到0%不等,凸显了医疗数据共享的困境。
在这篇发表在《npj Digital Medicine》的论文中,Lisa Pilgram、Khaled El Emam等研究人员从监管视角深入分析了合成健康数据中的患者隐私保护问题。他们系统回顾了目前全球仅有的三份SDG监管指南——来自英国信息专员办公室(ICO)、新加坡个人数据保护委员会(PDPC)和韩国个人信息保护委员会(PIPC),旨在阐明监管机构如何对待SDG和合成数据,以及合成数据在什么条件下可被视为非个人信息而安全共享。
研究人员采用比较分析法,对三份官方指南进行系统性内容分析,重点关注三个核心问题:个人信息是否可以在无额外同意的情况下用于SDG训练、合成数据被视为非个人信息的条件、以及除隐私外还有哪些推荐评估实践。通过对比不同司法管辖区的监管逻辑,揭示了合成数据监管的共性与差异。
Can personal information be processed without consent for SDG?
分析表明,三个司法管辖区均认为使用个人信息训练SDG模型构成个人数据处理行为,需要合法的处理基础。在英国,除同意外还可基于合法利益等六种同等有效的法律基础;新加坡允许基于研究目的或合法利益例外的SDG;韩国则明确SDG是个人信息的许可使用,无需单独同意。这表明在某些情况下,无需额外同意即可处理个人信息进行SDG,但需确保符合目的兼容性和公平性原则。
Are there conditions for treating synthetic data as non-personal information?
所有指南都承认合成数据被视为非个人信息是有条件的,即残余披露风险必须非常低。英国指南强调需评估从合成数据中统计推断个人信息的可能性;新加坡和韩国指南也表达了类似要求。然而,具体的隐私度量指标和风险阈值仍是活跃的研究领域,目前缺乏统一标准。各指南推荐了不同的脆弱性缓解措施,如异常值保护、差分隐私和数据最小化等。
What are other recommended evaluation practices beyond privacy?
除隐私评估外,三份指南都强调数据质量评估和伦理考量的重要性。质量评估包括保真度(统计特性相似性)和下游效用(特定任务性能)两个维度。伦理方面特别关注偏见风险,英国ICO明确要求对影响个人的决策用途进行强制性偏见检测和校正,反映了合成数据可能复制敏感模式而引发集体伤害的担忧。
研究结论表明,SDG并非规避隐私法规的手段,而是需要像其他PET一样受到监管约束。只有当残余风险足够低时,合成数据才能被视为非个人信息。监管指南涵盖了隐私、数据保护、质量和偏见风险的管理,声称SDG缺乏监管的说法不准确反映现状。
讨论部分指出,关于SDG规避监管的担忧主要针对商业行为者,但公众对商业实体使用健康数据的不信任并非合成数据特有。案例分析显示,即使数据使用合法,偏离最佳实践仍可能导致纠正措施,强调合法合规不足以维持公众信任。需通过加强透明度、可执行指南或伦理监督来弥补差距。
该研究的重要意义在于首次对SDG监管指南进行了比较分析,为合成健康数据的合规使用提供了清晰框架。随着ISO/IEC AWI TR 42103等新标准的制定和监管沙盒的推广,SDG的负责任采用将获得进一步支持。这项工作不仅对监管机构有参考价值,对日益生成和使用合成数据的研究社区也具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号