教育成就多基因评分对爱沙尼亚人口迁移行为及空间分化的遗传影响研究

《iScience》:Genetic effects on migration behavior contribute to increasing spatial differentiation at trait-associated loci in Estonia

【字体: 时间:2025年11月30日 来源:iScience 4.1

编辑推荐:

  本研究针对选择性迁移导致的基因-环境相关性偏差问题,通过分析爱沙尼亚生物样本库中18万个体的遗传和地理数据,发现向大城市迁移的个体携带更高的教育成就多基因评分(PGSEA),这种迁移模式通过家系内分析证实存在直接遗传效应,且自20世纪中期持续至今。该研究揭示了人口流动如何塑造群体遗传结构,对遗传关联研究中的混杂校正具有重要意义。

  
在遗传学研究中,一个长期存在的挑战是如何区分真正的基因-表型关联与由人口结构造成的虚假关联。传统方法通过校正基因组主成分(PCs)来控制种群分层,但这种方法假设迁移行为是随机的。然而,越来越多的证据表明,人类的迁移可能并非完全随机,而是与个体基因型存在系统性关联——特别是与教育成就(EA)相关的遗传因素。这种"选择性迁移"现象会形成新的基因-环境相关性,对遗传研究结果产生潜在偏差。
爱沙尼亚作为一个具有独特人口历史和地理特征的北欧国家,为研究这一问题提供了理想模型。该国拥有爱沙尼亚生物样本库(EstBB),包含了约21万成年人的基因型和表型数据,覆盖了全国20%的成年人口,且地理分布相对均匀。研究人员利用这一宝贵资源,深入探究了当代迁移行为如何影响复杂性状多基因评分(PGSs)的空间分布。
研究团队首先分析了183,576名欧洲遗传背景的EstBB参与者数据,其中41%的个体当前居住地(POR)与出生地(POB)不同。通过比较基于POB和POR的县域遗传差异,他们发现了一个有趣的现象:虽然迁移总体上减弱了基因组水平的种群结构(主成分分析显示POB解释的方差大于POR),但对于大多数多基因评分,情况却恰恰相反。
具体而言,研究人员测试了169个性状的PGSs,发现其中107个PGSs在POR时的县域间方差(Varcounty)显著高于POB时。教育成就多基因评分(PGSEA)表现出最强的效应,能够解释其他PGSs中大部分的空间分化信号。当调整掉PGSEA的影响后,其他PGSs的县域间差异大幅减少,这表明教育相关的遗传因素在驱动空间分化中起着核心作用。
为了探究这种分化的地理模式,研究团队绘制了爱沙尼亚各县的PGSEA平均值分布图。结果清晰显示,包含首都塔林(Tallinn)的哈留县(Harju)和包含大学城塔尔图(Tartu)的塔尔图县,其居民的PGSEA平均值显著高于全国平均水平,而其他大部分县则低于平均水平。进一步分析表明,这种分化主要是由PGSEA较高的个体从其他地区迁移到这两个大城市所驱动。
为了区分这种关联是源于直接的遗传效应还是家庭环境等混杂因素,研究人员采用了家系内分析设计。通过比较迁移到城市与留在原地的兄弟姐妹之间的PGSEA差异,他们发现即使在同一家庭内,迁移到塔林或塔尔图的个体仍然具有显著更高的PGSEA。这一发现强有力地支持了迁移行为存在直接遗传效应的假设,而非完全由共享的家庭环境所解释。
研究还发现,迁移距离与PGSEA存在正相关关系——从较远地区迁移到城市的个体,其平均PGSEA高于来自城市周边地区的迁移者。这种模式在20世纪初的爱沙尼亚已有迹象,当时来自更远地区的学生在智力测验中得分更高,尽管当时的测验方法与现代教育成就测量有所不同。
时间动态分析表明,城市与非城市地区之间的PGSEA差异从1940年代开始出现,并随着时间的推移而逐渐扩大。尽管爱沙尼亚经历了重大的社会政治变革,但这种选择性迁移的模式持续存在,显示出其背后机制的稳健性。
值得注意的是,教育成就表型本身也显示出与PGSEA相似的地理分布模式。当在统计模型中同时考虑PGSEA和教育成就时,PGSEA对迁移行为的预测效应虽然减弱,但仍然显著。通过GCTA-GREML分析,研究人员估计迁移行为与大学学历的遗传相关性高达0.8,表明这两个性状具有高度重叠但非完全一致的遗传基础。
本研究采用的主要技术方法包括:利用爱沙尼亚生物样本库(EstBB)的基因组数据和地理信息,进行主成分分析(PCA)以控制种群分层;计算169个复杂性状的多基因评分(PGS),重点分析教育成就PGS(PGSEA);采用家系内分析区分直接遗传效应与家庭环境混杂;使用逻辑回归模型评估PGS对迁移行为的预测效应;通过GCTA-GREML估计遗传相关性和遗传力。
结果
当代迁移增加了多基因评分的区域差异
与基因组主成分不同,大多数测试的PGSs在居住地(POR)时的县域间方差显著高于出生地(POB)时。PGSEA显示出最强的效应,且能够解释其他PGSs中大部分的空间分化信号。
教育成就多基因评分的地理分布
哈留县(含塔林)和塔尔图县(含塔尔图市)的居民平均PGSEA显著高于全国水平,而其他地区则低于平均水平。这种差异主要是由PGSEA较高的个体从其他地区迁移到这两个大城市所驱动。
不同迁移档案组的多基因评分比较
从其他地区迁移到哈留县或塔尔图县的个体,其PGSEA显著高于留在原地的个体。在同一家庭内,迁移到城市的兄弟姐妹也比留在原地的兄弟姐妹有更高的PGSEA,支持了直接遗传效应的存在。
迁移行为的教育成就多基因评分遗传关联
逻辑回归分析显示,PGSEA是预测从其他地区迁移到城市的重要因子,即使在控制教育成就表型后,这种关联仍然显著。家系内分析进一步证实了这一关联的稳健性。
教育成就多基因评分差异的时间积累
城市与非城市地区之间的PGSEA差异从20世纪中期开始出现,并随时间逐渐扩大,表明选择性迁移是一个持续数十年的长期过程。
讨论与结论
本研究通过分析爱沙尼亚的大规模遗传和地理数据,揭示了当代迁移行为如何导致复杂性状多基因评分的空间分化。最重要的发现是,教育成就相关的遗传因素在选择性地驱动个体向大城市迁移中起着核心作用,且这种关联至少部分源于直接的遗传效应,而非完全由环境混杂所解释。
这一现象具有重要的方法论意义。传统的种群分层校正方法(如主成分分析)假设迁移是随机的,但选择性迁移会创建新的基因-环境相关性,可能导致遗传关联研究中的偏差。特别是对于社会经济地位相关的性状,这种偏差可能更为明显。
研究结果还表明,选择性迁移可能是一种跨国家的普遍现象。爱沙尼亚的发现与之前在英国生物样本库中的观察一致,尽管两国在历史、文化和社会经济背景上存在差异。这种稳健性提示选择性迁移可能是现代社会中的一个基本人口过程。
从更广阔的视角看,这项工作展示了遗传因素如何与人口流动动态相互作用,共同塑造人类群体的空间遗传结构。迁移不仅是环境因素影响遗传组成的渠道,其本身也受到遗传因素的影响。这种双向关系为理解基因-环境交互作用提供了新的视角。
研究的局限性包括爱沙尼亚生物样本库可能不完全代表全国人口,以及地理信息可能存在不准确性。此外,PGSEA作为教育成就的遗传代理指标,本身可能包含各种混杂因素,不宜被简单解释为对教育结果的因果遗传影响。
总之,这项研究强调了在遗传学研究中考虑迁移行为非随机性的重要性,并指出家庭基础研究和出生地信息控制可能是减少相关偏差的有效策略。随着遗传数据的持续增长和多样化,理解基因-环境交互作用的复杂动态将成为推动精准医学和公平遗传研究的关键。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号