青藏高原-东亚交汇区藏彝走廊人群的基因组学研究:群体结构、适应性进化与古人类基因渗入
【字体:
大
中
小
】
时间:2025年10月11日
来源:Journal of Genetics and Genomics 7.1
编辑推荐:
本研究针对藏彝走廊(TYC)地区族群基因组研究不足的问题,通过对1031例样本(包括147例全基因组测序)的系统分析,揭示了约330万个新遗传变异和4个独特的遗传背景。研究证实了汉藏语系人群的共同起源,鉴定了与高原适应(如EPAS1)、免疫(HLA-DQB1)相关的选择信号及古人类(尼安德特人、丹尼索瓦人)基因渗入对心血管、免疫相关基因的影响,并发现了人群特异的致病性/药物反应(如VKORC1影响华法林敏感性)变异频率差异,为区域精准医学提供了关键遗传基础。
在人类基因组学研究飞速发展的今天,我们对自身遗传多样性的理解仍存在显著的空白。尽管欧洲、非洲、大洋洲和美洲等地的人群已积累了大量的基因组数据,但对于东亚地区,特别是中国境内 ethnolinguistically diverse(具有不同民族语言背景)的人群,尤其是生活在重要地理过渡带——藏彝走廊(Tibetan-Yi Corridor, TYC)的族群,其基因组研究仍非常有限。藏彝走廊地处青藏高原东缘,是连接高原与东亚低地的关键 agro-pastoral region(农牧交错带),数千年来一直是人类迁徙和文化交流的重要通道。该区域地形复杂,生态环境多样,孕育了丰富的民族、语言和生物多样性。然而,由于样本获取困难和研究资源有限,TYC人群的遗传起源、对当地环境(如高海拔、强紫外线)的适应性进化、古人类基因渗入的历史及其对现代健康的影响等一系列关键科学问题,至今尚未被深入揭示。这种认知的缺失,不仅限制了我们对于人类演化历史的完整理解,也阻碍了针对这些特定人群的精准医学的发展。
为了填补这一空白,由重庆医科大学基础医学院法医学系的贺光林研究员团队领导的一项大规模基因组学研究应运而生,其研究成果正式发表于《Journal of Genetics and Genomics》。研究人员克服困难,收集了来自藏彝走廊及周边地区的1031例个体样本,其中包括147例来自13个代表性不足的藏缅语系和南亚语系族群的深度全基因组测序(Whole-Genome Sequencing, WGS)数据,以及884例中原地区汉族的基因组基因分型数据。通过对这些珍贵样本的高通量测序和精细的生物信息学分析,研究团队旨在系统解析TYC人群的精细遗传结构,追溯其复杂的 demographic history(群体历史),探索其独特的适应性遗传印记,并评估古人类基因渗入和 medically relevant variants(医学相关变异)在其基因组中的分布与意义。
为完成这项复杂的研究,作者团队运用了多种关键技术。在数据产生层面,对147个样本进行了平均深度为12.5×的全基因组测序,并对884个样本进行了芯片基因分型。在数据分析层面,综合运用了群体遗传学标准分析方法,包括主成分分析(PCA)、群体结构分析(ADMIXTURE)、固定指数(FST)计算、f-统计量(f3/f4-statistics)以推断遗传关系和基因流,利用qpAdm和qpWave进行祖先成分建模,通过MSMC2和SMC++估算有效群体大小(Ne)和分化时间,应用fineSTRUCTURE进行基于单倍型的精细聚类。在适应性进化分析中,采用了群体分支统计(PBS)和整合单倍型得分(iHS)来检测自然选择信号。此外,还使用IBDmix和SPrime软件来高置信度地鉴定来自尼安德特人和丹尼索瓦人的古人类基因渗入片段。最后,通过与ClinVar、PharmGKB等数据库比对,系统注释了致病性/可能致病性(P/LP)变异和药物基因组学相关位点。
研究人员对147个TYC样本进行了深度全基因组测序,共识别出13,662,805个双等位基因单核苷酸多态性(SNP)和1,689,560个小片段插入/缺失(InDel)。其中,约330万个(24.4%)为新型变异,且绝大多数(89%)为罕见变异(次要等位基因频率MAF < 0.01)。功能注释显示,这些变异分布于内含子区、编码区等不同功能区域,为后续研究提供了宝贵的遗传变异资源库。
通过主成分分析(PCA)和遗传距离(FST)计算,研究发现TYC人群在遗传上形成了由北到南的梯度分布,并可进一步划分为四个主要的遗传谱系(Lineage):TYC高原谱系(THL,主要包括安多藏族、普米族等)、TYC中部谱系(TCL,主要包括白马藏族、纳西族、彝族等)、TYC南部谱系(TSL,主要包括拉祜族、哈尼族、佤族、布朗族等)和TYC东部谱系(TEL,主要包括羌族、白族等)。THL与青藏高原藏族人群遗传关系最近,而TSL则与东南亚 Tai-Kadai(侗台语系)人群表现出更近的遗传亲和性。
基于模型的ADMIXTURE分析和正式的群体历史建模(qpAdm)表明,TYC人群,特别是藏缅语系人群,其主要祖先成分可追溯至黄河中游地区的仰韶文化等新石器时代粟作农业人群,支持了汉藏语系人群起源于中国北方的假说。同时,不同谱系所受的基因流影响各异:THL保留了较高比例的高原古代人群成分;TCL则混合了北部和部分南部祖先成分;TEL与中原汉族人群遗传联系紧密;而TSL则显示出更高比例的与长江流域稻作农民及东南亚古老人群相关的南部祖先成分。
通过MSMC2和SMC++等分析方法,研究估算了TYC各人群的分化时间。结果显示,藏缅语系人群与汉族人群的分化大约发生在1.3-1.4万年前,而TYC内部不同谱系之间的分化则发生在此之后,TSL与其他谱系的分化最早(约1.5-2.1万年前)。有效群体大小(Ne)的变化趋势表明,TEL和TCL人群在过去的1.1万年中经历了显著的群体扩张,这与农业传播带来的 population growth(人口增长)相符;而THL和TSL人群则长期保持相对较小且稳定的有效群体规模,暗示了其历史上可能经历了较长时间的隔离。
基因组扫描发现了TYC人群中共有的和谱系特异的自然选择信号。在THL中,除了已知的高原适应关键基因如EPAS1、EGLN1外,还发现了与皮肤色素沉着相关的MC1R基因以及可能与缺氧反应相关的SIPA1L3基因受到选择。在TSL中,免疫相关基因HLA-DQB1显示出强烈的选择信号,这可能与该人群对当地病原体环境的适应有关。对中原汉族人群的分析也揭示了与骨骼发育、代谢等相关的适应性基因。
研究系统评估了TYC人群中的医学相关遗传变异。在ACMG SF v3.2推荐的基因列表中,仅发现3个个体携带可报告的次要发现变异。然而,在ClinVar数据库注释的致病性/可能致病性(P/LP)变异中,85%的个体携带至少一个此类变异。值得注意的是,一些罕见病相关基因的致病变异,如与21-羟化酶缺乏症相关的CYP21A2、与周围神经病变相关的PRX等,在TYC特定人群中的携带者频率显著高于其他人群。药物基因组学分析显示,影响华法林敏感性的VKORC1 rs9923231等位基因在TYC人群中普遍存在,但其频率在不同遗传背景的亚群中存在差异,提示了临床用药剂量可能需要个体化调整。
通过整合IBDmix和SPrime的分析结果,研究在TYC人群基因组中鉴定出413段可能来自尼安德特人和40段可能来自丹尼索瓦人的高置信度渗入序列。匹配率分布支持了东亚人群可能存在两波丹尼索瓦人基因渗入事件的假说。著名的藏族高原适应基因EPAS1的单倍型在TYC北部人群中也存在,且与丹尼索瓦人单倍型更接近。功能分析表明,这些古人类渗入的片段富集在与心血管功能(如CXADR)、免疫代谢(如HLA区域基因)、乙酰胆碱受体信号通路(如CHRND)等相关的表型上,提示古人类基因渗入可能通过贡献适应性等位基因,在现代TYC人群应对局部环境压力中发挥了重要作用。
综上所述,这项研究通过对藏彝走廊地区人群进行大规模、高深度的全基因组测序和分析,极大地丰富了我们对于这一关键区域人类遗传多样性的认识。研究结果从多个层面提供了强有力的证据:首先,在群体历史方面,证实了汉藏语系人群的共同起源,并精细地描绘了TYC人群作为连接青藏高原与东亚低地的重要通道,其复杂的遗传结构是由史前分化、农业扩散以及历史上多次基因流事件共同塑造的结果。其次,在适应性进化方面,不仅验证了已知的高原适应基因,还发现了新的与色素沉着、免疫调节等相关的选择信号,揭示了不同生态环境下人群的差异化适应策略。再者,研究详细刻画了古人类基因渗入在TYC人群基因组中的范围和潜在功能,将 archaic introgression(古人类基因渗入)的研究从高原藏族拓展到了更广泛的过渡地带人群。最后,也是极具转化医学价值的一点是,研究系统地评估了TYC人群特异的疾病相关变异和药物基因组学特征,强调了在当前以欧洲人群数据为主的基因组医学背景下,纳入 underrepresented populations(代表性不足人群)对于实现精准医学的公平性与准确性的至关重要性。
该研究的发现不仅为人类学、遗传学和进化生物学提供了宝贵的资料,也为未来的医学研究奠定了坚实的基础。它所产生的高质量基因组数据将成为区域特异性遗传变异数据库的重要补充,有助于改善对TYC人群疾病风险的评估和药物反应的预测。同时,研究也指出了未来的方向,例如需要纳入更多更小众的族群、结合古代DNA证据、以及通过功能实验验证候选适应性变异的生物学机制等。总之,这项工作标志着我们对中华民族多元一体格局的遗传基础及其健康影响的理解迈出了重要一步,为开展针对中国不同人群的精准医学实践提供了科学依据。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号