编辑推荐:
为解决基因组数据与人群观察数据整合的难题,比利时研究人员开展 “人类基因组数据与人群观察数据整合” 主题研究。结果显示该过程复杂耗时,提出多方面建议。这为全球公共卫生基因组学研究提供重要参考。
在健康医学领域,随着科技飞速发展,基因组学研究取得了显著进展。然而,将基因组数据与其他各类健康相关数据整合起来进行研究,却面临着重重挑战。基因组数据因其独特的识别特性和诸多伦理问题,极为敏感,在整合过程中需要严格的安全措施以及透明的沟通机制,以保障数据的保密性,维护公众的信任。
与此同时,复杂疾病如癌症,其发病和发展受到多种因素影响,包括遗传因素、社会经济状况、生活方式、环境暴露以及医疗保健的质量和可及性。为了深入了解这些因素之间的相互作用,全面探究疾病的发生机制,进而实现精准的公共卫生干预,将基因组数据与人群观察数据进行整合研究显得尤为必要。
在这样的背景下,比利时的研究人员开展了一项试点研究。该研究旨在评估遗传和非遗传健康决定因素与癌症的关联,同时探索将基因组数据与国家人群数据集相链接的可行性与复杂性。研究由来自比利时多个机构的人员参与,包括 Sciensano 的流行病学和公共卫生科学局、比利时癌症登记处、鲁汶天主教大学健康与社会研究所等。
研究人员通过一系列步骤开展研究。首先,确定研究人群和数据来源,包括比利时健康访谈调查(BELHIS)和比利时健康检查调查(BELHES)的参与者血液样本,这些样本可用于 DNA 测序,同时还整合了比利时癌症登记处(BCR)的数据、国家统计局(Statbel)的行政和社会经济数据。在设计数据流程架构时,利用比利时居民的国家登记号码(NRN)作为唯一标识符,结合可信第三方(TTP)的服务,保障数据链接的安全性和准确性。之后,研究人员还完成了数据访问程序相关工作,包括与伦理委员会(EC)、信息安全委员会(ISC)沟通,获取相关批准,以及签订合作协议等。
在技术方法方面,主要包括以下关键内容:一是样本队列的选择,选取 BELHIS 和 BELHES 中同意提供血液样本用于 DNA 分析的参与者作为研究对象;二是数据获取技术,采用全基因组测序(WGS)技术获取基因组数据;三是数据链接技术,借助 NRN 和 TTP 实现不同数据源数据的准确链接。
研究结果如下:
- 数据整合过程复杂且耗时:从 2023 年 1 月研究启动到 2025 年 1 月初获批,整个过程长达两年。期间,研究范围多次调整,与各数据提供方、伦理委员会和信息安全委员会的沟通协调工作繁琐,众多步骤需依次进行,导致时间延长。
- 伦理审批和同意书存在问题:现有伦理审批和知情同意书(ICF)的覆盖范围不明确,解读存在差异。EC 关注参与者重新联系和结果告知医生等问题,但这些在本试点研究中不适用,研究旨在评估数据整合的可行性,结果暂不向参与者报告。
- 行政和法律程序繁琐:各数据提供方的行政程序和内部工作流程不同,指南不公开,需通过非正式渠道获取信息,确定步骤顺序困难,且各类申请表格信息重复,增加了工作负担。
研究结论和讨论部分指出,虽然研究面临诸多挑战,但也为未来的数据链接研究提供了宝贵经验。建立可互操作的数据目录、设立中央协调机构、规范数据访问请求、制定预先合作协议以及规划可持续性发展等建议,有助于提高数据整合研究的效率,加强利益相关者的合作,解决法律和伦理问题。该研究成果发表在《Archives of Public Health》上,其结论不仅对比利时本国,对全球范围内开展公共卫生基因组学研究的人员都具有重要的参考价值,为后续研究提供了实践指导和方向,推动公共卫生基因组学领域朝着更加系统、高效的方向发展。