编辑推荐:
为探究江苏汉族群体遗传多态性及父系遗传结构,研究人员分析 374 名男性个体的 29 个 Y 染色体短串联重复序列(Y-STRs)和 183 个单核苷酸多态性(Y-SNPs)。发现 Y29 系统鉴别力最强,江苏汉族主要为 O 单倍群,且与南方汉族遗传关系更近,为相关研究提供重要数据。
在人类遗传学的神秘领域中,Y 染色体宛如一把珍贵的钥匙,蕴藏着人类父系遗传的古老密码。人类 Y 染色体约 60 兆碱基对,其中 95% 的非重组区域(NRY)以单倍型形式由父亲传给儿子,为研究父系遗传提供了独特线索。Y 染色体短串联重复序列(Y-STRs)和单核苷酸多态性(Y-SNPs)作为其上的重要遗传标记,在法医学个体识别、亲子鉴定以及群体遗传学研究中发挥着关键作用。
汉族作为中国人口最多的民族,其内部存在显著的遗传多样性。以往研究虽对南方和北方汉族的遗传模式有一定探索,但像江苏汉族这样处于南北过渡地带的亚群体,其遗传特征却鲜为人知。江苏地理位置特殊,是南北文化和人口交流的重要枢纽,研究江苏汉族群体的遗传结构,对于深入了解汉族遗传多样性的分布规律,以及追溯古代人口迁移和融合历史意义重大。然而,此前针对江苏汉族的研究多聚焦于 Y-STR 标记,且分析的位点数量有限,对 Y-SNP 单倍群的分布和父系遗传结构缺乏全面研究。为填补这些空白,来自山东第一医科大学、复旦大学等机构的研究人员开展了一项极具意义的研究,相关成果发表在《BMC Genomics》上。
研究人员为深入剖析江苏汉族群体的遗传奥秘,采用了多种关键技术方法。在样本采集方面,经中国司法部司法鉴定科学研究院伦理委员会批准,收集了 374 名三代以上均居住在江苏的男性外周血样本。随后,运用 QIAamp DNA blood Mini Kit 提取基因组 DNA。对于 Y-STR 分型,使用 Goldeneye 29Y 试剂盒,通过毛细管电泳技术对 29 个 Y-STR 位点进行检测;对于 Y-SNP 分型,则利用基于基质辅助激光解吸电离飞行时间质谱(MALDI-TOF MS)平台的自行设计的 183 个标记面板进行分析 。最后,运用多种数据分析方法,如直接计数法、Arlequin 软件、IBM SPSS Statistics 23 软件等,对数据进行深入挖掘。
Y-STR 单倍型分析
研究人员从 374 名男性样本中成功鉴定出 374 种独特单倍型,共观察到 206 个等位基因。不同 Y-STR 位点的等位基因数量差异较大,如单拷贝的 DYS645、DYS393 等位点有 4 个等位基因,而 DYS458 位点则有 12 个等位基因 。在多拷贝的 DYS385a/b 位点,发现了 17 个等位基因和 58 种单倍型。此外,还检测到 1 个无效等位基因和 6 个中间等位基因,其中 DYS645(7.1)为首次报道。
进一步对 5 种 Y-STR 分型系统(MHT、EXT、PPY12、Yfiler 和 Y29)进行法医参数分析,结果显示随着 Y-STR 位点数量增加,鉴别能力显著提升。MHT 系统(9 个 Y-STR 位点)的鉴别能力(DC)仅 0.8021,单倍型多样性(HD)为 0.9983;而 Yfiler 系统(17 个 Y-STR 位点)的 DC 提升至 0.9786,HD 为 0.9999;Y29 系统(29 个 Y-STR 位点)表现最为出色,DC 和 HD 均达到 1,鉴别能力最强,非常适合江苏汉族群体的法医应用。
基于 Y-STR 的群体比较
为揭示江苏汉族与其他群体的遗传关系,研究人员基于 17 个 Y-STR 位点(Yfiler 试剂盒)计算了 25 个中国群体间的遗传距离(Fst)和 p 值。结果显示,江苏汉族与常州汉族的遗传距离最近(Fst =0.0033,p=0.2295) ,与新疆哈萨克族的遗传距离最远(Fst =0.5501,p=0.4337)。
通过多维尺度分析(MDS)和邻接法(NJ)构建的系统发育树发现,江苏汉族与中国其他汉族亚群体遗传分化不显著,但与部分少数民族群体有明显区别。在 MDS 图中,江苏汉族与南方汉族群体在中右区域紧密聚集,同时与北方汉族群体也较为接近,呈现出过渡性的遗传结构;在 NJ 系统发育树中,江苏汉族和其他汉族群体形成与少数民族群体分离的独立分支,不过海南黎族和凉山彝族因历史通婚等原因与汉族群体更为接近。此外,与 9 个外群体比较发现,江苏汉族与东亚和东南亚群体关系密切。
Y-SNP 单倍群分布
在江苏汉族群体中,共观察到 7 个主要单倍群,分别为 O(85.03%)、C(9.09%)、K(4.01%)、D(0.53%)、Q(0.8%)、J(0.27%)和 R(0.27%) ,还检测到 83 种独特的末端单倍群。其中,O 单倍群最为常见,可进一步分为 O1 和 O2 两个亚单倍群。O1 单倍群在江苏汉族中的频率为 26.20%,与南方汉族群体特征相符(南方汉族中 O1 单倍群通常超过 25%) ;O2 单倍群频率为 58.82%,并进一步细分为 O2a1(17.11%)、O2a2a(10.16%)、O2a2b(30.75%)和 O2b1a(0.8%)四个亚群。
与其他东亚和东南亚群体比较发现,O 单倍群在所有研究群体中均占主导地位,但不同地区 O1 和 O2 亚单倍群的分布频率存在差异。在日本和部分东南亚国家(泰国、印度尼西亚、菲律宾),O1 亚单倍群更为普遍;而在中国汉族、韩国和越南,O2 亚单倍群的频率更高。此外,C 单倍群在东亚(不含日本)为第二大常见单倍群,D 单倍群在日本人群中频率较高,N 单倍群主要分布在韩国和中国北方汉族。
基于 Y-SNP 的群体比较
基于 Y-SNP 单倍群频率构建的 MDS 图显示,中国汉族群体(除广西汉族)在图的右侧紧密聚集,表明汉族群体之间遗传相似性较高。江苏汉族与南方汉族群体(如广东、福建等)聚类紧密,遗传距离较小;而与中国回族群体(如云南回族、甘肃回族)、少数民族群体(如黎族、傣族)以及部分东亚和东南亚群体(如韩国、日本、越南、泰国)存在明显遗传分化,体现了其在汉族遗传框架内的独特位置。同时,古代台湾人群在 MDS 图中的位置与大多数现代人群明显不同。
网络分析
利用中位数连接(MJ)法构建 O 亚单倍群内的 STR 单倍型网络,结果显示在 O1、O2a1、O2a2a 和 O2a2b 单倍群网络中,江苏汉族个体与南方汉族、北方汉族个体相互交织,存在共享单倍型连接。在 O1 网络中,江苏汉族位于中心位置,对单倍型多样性贡献较大;在其他 O2a 亚单倍群网络中,江苏汉族分布在不同分支,部分形成明显亚簇。网络拓扑结构显示 O2a2a 呈中心星状结构,暗示可能存在奠基者效应或近期群体扩张。O1 和 O2a2b 亚簇与南方汉族群体遗传距离更近,O2a1 与北方汉族单倍型有部分重叠,表明江苏汉族在遗传上受到南北汉族的双向影响。
AMOVA 和混合分析
分子方差分析(AMOVA)结果表明,对于 Y-SNP 数据,大部分遗传变异(93.84%,p<0.001)来自群体内部差异,群体间存在中度变异(3.08%,p<0.001)且差异显著(p=0.027);对于 Y-STR 数据,绝大部分变异(98.90%,p<0.001)存在于群体内部,群体间变异较小(1.22%,p<0.001)且无显著差异。这表明 Y-SNP 在揭示群体间和群体内遗传分化模式方面更为敏感。
利用 Admix 2.0 软件进行混合分析,结果显示江苏汉族约 89% 的遗传祖先来自南方汉族,11% 来自北方汉族,有力支持了江苏汉族主要起源于南方汉族的假设。
研究通过整合 Y-STR 和 Y-SNP 分析,系统地描绘了江苏汉族群体的父系遗传结构,为其进化历史研究提供了新视角,也在法医学领域具有重要意义。Y29 多重检测系统极高的鉴别能力(DC=1)和单倍型多样性(HD=1) ,为该群体个体识别提供了强大工具,有助于构建群体特异性法医数据库和完善东亚地区亲缘关系推断模型。
在遗传结构方面,研究明确了江苏汉族中 O 单倍群的主导地位,以及其与南方汉族更为紧密的遗传关系,同时也揭示了北方汉族对其遗传组成的贡献,反映了历史上大规模人口南迁和区域基因交流的影响。然而,该研究也存在一定局限性,如亚区域采样范围有限,且仅依赖 Y 染色体标记。未来研究若能整合常染色体和线粒体数据,将更精确地解析群体精细结构。总体而言,这项研究为汉族亚群体的遗传特征研究做出了重要贡献,推动了人类学和法医学的发展。