社会安全号码缺失或不完整对癌症登记链接敏感性的影响及对队列研究的启示
【字体:
大
中
小
】
时间:2025年09月28日
来源:Epidemiology 4.4
编辑推荐:
本研究针对癌症队列链接中社会安全号码(SSN)缺失或不完整的问题,由研究人员通过概率链接方法(Match*Pro软件)分析CPS-3队列数据,发现即使SSN部分缺失,结合姓名、出生日期等个人信息仍可实现高灵敏度链接(手动审核后达98.6%),为包容性癌症研究设计提供了关键技术支持。
背景:将癌症队列参与者与州癌症登记处链接通常依赖于个人可识别信息,包括唯一标识个体的社会安全号码(Social Security Number, SSN)。然而,由于隐私问题,完整SSN的收集可能受限。本研究评估了使用部分或缺失SSN进行癌症登记链接的敏感性,并分析了人口统计学特征的差异。
方法:利用癌症预防研究-3(Cancer Prevention Study-3, CPS-3)中284,361名参与者的数据,通过Match*Pro软件与佐治亚州、俄亥俄州和德克萨斯州的癌症登记处进行概率链接。链接使用不同组合的个人可识别信息:完整SSN、部分SSN(最后四位数字)和缺失SSN。比较了手动审核前后链接的敏感性,并按性别、年龄和种族-民族进行了分层分析。
结果:手动审核前,缺失和部分SSN的链接敏感性为92.5%。手动审核后,缺失SSN的敏感性提高至98.6%,部分SSN提高至98.8。未观察到性别、年龄或种族-民族的显著异质性,所有亚组的敏感性均超过87%。手动审核大幅减少了不确定匹配,贡献了高链接准确性。
讨论:本研究证明,即使没有完整SSN,只要其他个人可识别信息(如姓名、出生日期、纵向地址)可用,即可实现癌症登记链接的高敏感性。这些发现支持在SSN数据有限的队列中准确识别癌症病例的可行性,尤其对历史上边缘化人群,并强调了设计包容性人群基础癌症研究的重要性。
通俗摘要:本研究探讨了在不使用完整社会安全号码(SSN)的情况下,如何有效将大型癌症预防研究的参与者与癌症登记数据链接。通过使用部分SSN或其他个人信息(如姓名、出生日期、地址),研究人员在手动审核前实现了92.5%的链接敏感性,审核后缺失SSN和部分SSN的敏感性分别提高至98.6%和98.8%。研究在不同人口统计学群体中表现一致,表明即使SSN数据有限,也能可靠识别癌症病例,这对促进癌症研究的多样性尤为有益。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号