编辑推荐:
为探究西班牙人群的遗传结构、基因流及正向选择信号,研究人员分析 GCAT 队列 704 个全基因组序列。结果发现北非混合信号,鉴定出与免疫、饮食等相关的新候选基因。该研究为了解西班牙人群遗传演化提供重要依据。
在人类演化的漫长画卷中,遗传密码宛如隐藏的线索,记录着各个族群的发展轨迹。伊比利亚半岛位于欧洲西南角,独特的地理位置使其在基因交流与选择压力方面别具一格。然而,长期以来,西班牙人群过去的人口演变和遗传适应性一直是未解之谜,就像被迷雾笼罩,亟待揭开。为了穿透这层迷雾,来自西班牙等多地的研究人员,以位于巴塞罗那的庞培法布拉大学(Universitat Pompeu Fabra)的研究团队为主力,开展了一项极具意义的研究,相关成果发表于《Scientific Reports》。
现代人类走出非洲后,在全球范围内迁徙和扩张,不同人群的遗传多样性和适应性随之产生差异。伊比利亚半岛虽地处欧洲,却因与非洲隔海相望,且有山脉与欧洲大陆分隔,其遗传演化过程受到多种因素影响。此前,尽管对西班牙人群的研究有一定进展,但仍存在诸多空白,比如未能明确 16 世纪法国宗教战争引发的人口迁徙对西班牙基因库的影响,也未找到西班牙特有的正向选择信号。在此背景下,研究人员决定深入挖掘西班牙人群的遗传奥秘。
研究人员主要运用了全基因组测序(Whole Genome Sequencing,WGS)、主成分分析(Principal Component Analysis,PCA)、ADMIXTURE 分析、fineSTRUCTURE 分析等技术方法。他们以 GCAT 队列中 785 名加泰罗尼亚居民的全基因组测序数据为基础,经严格筛选最终确定 704 个样本(Dataset A)。同时,结合 1000 Genomes Project 数据及古代 DNA 数据集,对数据进行处理和分析。
遗传结构和人口统计学分析
通过 PCA 分析发现,GCAT 样本主要聚集在欧洲人群(EUR)组内,且与伊比利亚人(IBS)和托斯卡纳人(TSI)关系紧密。ADMIXTURE 分析表明,GCAT 数据集主要为欧洲血统,还包含少量北非和中东血统。进一步的 fineSTRUCTURE 分析显示,西班牙人群可分为东西两个主要分支,且东西分支均存在一次混合事件,混合时间约在公元 1153 - 1287 年。
寻找选择信号
研究人员运用 SDS 和 XP-EHH 两种方法检测选择信号。SDS 分析发现,部分信号与欧洲人浅色皮肤色素沉着相关基因重叠,如 SLC45A2、OCA2 - HERC2 等;还发现与饮食相关基因,如 LCT - MCM6(与乳糖耐受相关)、SLC22A4(编码麦角硫因转运蛋白)等也存在选择信号。XP-EHH 分析则检测到一些与浅色皮肤色素沉着和适应低紫外线辐射相关的区域。此外,研究还发现多个与免疫反应相关的候选区域,如 MHC III 区域包含众多免疫相关基因。
新的适应候选基因
研究还发现了一些此前未报道的候选区域和新的选择变异。例如,SMYD1 基因内含子 SNP rs35662596、FDFT1 基因内含子 SNP rs1296025、UBL7 区域的调控变异 rs750607 等,这些基因分别与免疫、胆固醇代谢等功能相关,可能在西班牙人群的适应过程中发挥重要作用。
本地祖先偏差分析
研究人员探索了与特定古代或现代血统相关的本地祖先偏差(Local Ancestry Deviations,LAD)区域。在现代 LAD 分析中,发现 6 号染色体上部分区域存在北非和中东血统过量,且与 SDS 检测到的正向选择峰重叠。在古代 LAD 分析中,发现部分区域存在西部狩猎采集者(WHG)、早期草原游牧民(ENS)和早期欧洲农民(EEF)血统偏差,其中一些区域与选择信号重叠,如 LCT - MCM6 峰和 MHC III 区域显示 ENS 血统偏差。
研究结论表明,GCAT 队列能较好地代表西班牙人群的遗传特征。研究人员不仅检测到北非对西班牙人群的遗传贡献,还发现了新的正向选择候选基因,这对理解西班牙人群的遗传演化具有重要意义。不过,研究也存在一定局限性,如样本地理分布不平衡、选择峰定义参数可能引入偏差、北非代理人群样本量不足等。尽管如此,该研究为后续深入研究西班牙人群的遗传适应性和演化历史奠定了坚实基础,有助于人们更全面地了解人类遗传多样性的形成机制,也为相关疾病研究和精准医学发展提供了有价值的信息。