
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:基因组数据分析中推进健康公平性的方法学机遇
【字体: 大 中 小 】 时间:2025年05月16日 来源:Nature Reviews Genetics
编辑推荐:
这篇综述系统探讨了基因组数据分析方法的选择如何影响研究公平性,重点介绍了新兴的统计与机器学习(ML)技术(如GWAS1、PGS2)在识别和校正数据偏差中的作用,为促进基因组医学的公平实践提供了方法论框架。
当前基因组研究的样本代表性不足可能加剧健康差异。例如,全基因组关联分析(GWAS)中欧洲血统样本占比超过78%,导致多基因评分(PGS)在其他群体中预测效能下降1。这种偏差不仅存在于基础研究,还延伸至临床变异解读和功能基因组学注释环节。
新兴的混合模型(如ML-based ancestry adjustment)和贝叶斯分层方法正被用于量化批次效应和人群分层偏差。值得注意的是,2022年提出的EQUITY-GWAS框架通过整合社会 determinants of health(SDOH)协变量,将变异关联分析的跨群体适用性提高了32%2。
在变异优先级方面,基于深度学习的DeepHEFA算法显著改善了罕见变异在非欧人群中的临床解读准确性(AUC提升0.17)。然而,单纯依赖计算方法无法解决样本收集层面的结构性不平等,这需要与社区参与式研究(CBPR)相结合。
表型-环境交互作用建模和单细胞多组学整合将成为突破点。例如,空间转录组(ST)数据与电子健康记录(EHR)的耦合分析,可能揭示环境暴露对基因表达的群体特异性影响。但必须警惕"算法公平性悖论"——过度校正可能导致生物学真实信号的丢失。
(注:1全基因组关联研究;2多基因评分)
生物通微信公众号
知名企业招聘