
-
生物通官微
陪你抓住生命科技
跳动的脉搏
生物样本库规模数据集中有害罕见变异的采样策略与地理广度影响研究
【字体: 大 中 小 】 时间:2025年06月04日 来源:Proceedings of the National Academy of Sciences 9.4
编辑推荐:
这篇研究通过理论建模与UK Biobank实证分析,揭示了地理采样广度(geographic breadth)对罕见有害变异(deleterious rare variants)发现的“发现-稀释”双重效应:广泛采样增加变异数量(discovery effect),但降低等位基因频率(dilution effect)。研究为群体遗传学(population genetics)中的位点频率谱(SFS)分析和负选择(negative selection)推断提供了空间采样偏差校正框架,对生物医学关联研究和进化参数估计具有重要方法论意义。
随着生物样本库(biobank)规模基因组数据的爆发式增长,人类遗传学研究进入百万样本时代。然而,现有数据集存在欧洲血统偏倚,而新兴多样化生物样本库的构建使得采样地理广度(geographic breadth)成为关键变量。本研究聚焦核心问题:采样地理广度如何影响有害罕见变异的发现数量与频率分布?这一问题的解答对疾病关联研究和进化参数推断具有双重意义——罕见大效应变异是复杂疾病遗传架构和药物靶标研究的关键,而其频率谱(SFS)更是推断适应性进化(如分布适合度效应DFE)的核心依据。
研究团队建立了一个融合空间扩散、遗传漂变、选择压力和突变过程的随机模型。关键创新点在于:
理论分析与模拟验证揭示了两大对立效应:
值得注意的是,全基因组平均杂合度(μ/s)与采样策略无关,这一理论预测在UK Biobank的错义变异(missense)和同义变异(synonymous)数据中得到验证。
研究发现:
通过UK Biobank的出生地坐标重采样实验,研究观察到:
模型拟合显示英国人群参数:扩散尺度σ≈21-52km,选择系数sLoF≈0.01,与进化理论预期一致。未来研究需整合人口增长、远距离迁移等非平衡因素,以完善空间遗传学框架。
这项研究为理解采样设计如何塑造遗传发现提供了量化工具,也为跨群体遗传学研究的方法标准化奠定基础。
生物通微信公众号
知名企业招聘