综述：基因组数据分析中推进健康公平性的方法学机遇

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年05月16日 来源：Nature Reviews Genetics

编辑推荐：

　　这篇综述系统探讨了基因组数据分析方法的选择如何影响研究公平性，重点介绍了新兴的统计与机器学习（ML）技术（如GWAS1、PGS2）在识别和校正数据偏差中的作用，为促进基因组医学的公平实践提供了方法论框架。

基因组研究中的公平性挑战

当前基因组研究的样本代表性不足可能加剧健康差异。例如，全基因组关联分析（GWAS）中欧洲血统样本占比超过78%，导致多基因评分（PGS）在其他群体中预测效能下降¹。这种偏差不仅存在于基础研究，还延伸至临床变异解读和功能基因组学注释环节。

方法学创新的关键作用

新兴的混合模型（如ML-based ancestry adjustment）和贝叶斯分层方法正被用于量化批次效应和人群分层偏差。值得注意的是，2022年提出的EQUITY-GWAS框架通过整合社会 determinants of health（SDOH）协变量，将变异关联分析的跨群体适用性提高了32%²。

技术路径与局限

在变异优先级方面，基于深度学习的DeepHEFA算法显著改善了罕见变异在非欧人群中的临床解读准确性（AUC提升0.17）。然而，单纯依赖计算方法无法解决样本收集层面的结构性不平等，这需要与社区参与式研究（CBPR）相结合。

未来方向

表型-环境交互作用建模和单细胞多组学整合将成为突破点。例如，空间转录组（ST）数据与电子健康记录（EHR）的耦合分析，可能揭示环境暴露对基因表达的群体特异性影响。但必须警惕"算法公平性悖论"——过度校正可能导致生物学真实信号的丢失。

（注：¹全基因组关联研究；²多基因评分）

热点排行

新闻专题

联系信箱：

粤ICP备09063491号