
-
生物通官微
陪你抓住生命科技
跳动的脉搏
全球Y-SNP单倍群数据库UYSD的建立与应用:推动人类遗传多样性研究与法医遗传学发展
【字体: 大 中 小 】 时间:2025年05月09日 来源:European Journal of Human Genetics 3.7
编辑推荐:
为解决Y-SNP数据分散、命名混乱及分析工具不统一的问题,研究人员开发了首个综合性Y-SNP数据库UYSD。该平台整合全球27个种群6637例男性数据,支持自动化分析工具Yleaf v3,提供交互式地图、频率插值及系统发育树可视化功能,显著提升了Y染色体单倍群研究的标准化与可及性,对群体遗传学、法医学及古DNA研究具有里程碑意义。
Y染色体作为父系遗传的标志性载体,其单核苷酸多态性(Y-SNP)形成的单倍群(haplogroup)为研究人类迁徙、种群分化提供了独特视角。然而,过去40年间,海量Y-SNP数据分散于数千篇文献中,不同研究使用的命名体系和技术标准各异,导致数据整合困难。例如,早期研究仅能分析数十个Y-SNP,而现代全基因组测序(WGS)可检测数万个位点,这种技术鸿沟使得跨研究比较几乎成为不可能。更棘手的是,现有数据库如YHRD仅支持基础单倍群,无法满足高分辨率研究需求。这种碎片化现状严重阻碍了Y染色体在人类学、法医学等领域的应用。
针对这一挑战,由荷兰伊拉斯姆斯医学中心等29个机构组成的国际团队开发了通用Y-SNP数据库(UYSD)。这一平台首次实现了多技术平台数据的标准化整合——既兼容传统SNaPshot分型数据,也支持高通量测序结果。通过采用YFull YTree v10.01作为系统发育框架,UYSD成功纳入28,379个分支节点,并开发出三大核心功能:动态热图展示全球单倍群分布、基于地理距离的频率插值算法,以及交互式系统发育树查询。研究团队通过多中心协作收集了全球27个种群6,637例男性样本,涵盖离子扩增子测序(78%)、WGS(17%)和SNaPshot(5%)三种技术平台的数据,验证了平台的兼容性。
研究结果部分揭示了显著的种群分化模式。在基础单倍群层面,欧洲样本中R单倍群(39%)和I单倍群(15%)占主导,而E单倍群(16%)在非洲高频出现,这与已知历史迁徙路径一致。值得注意的是,通过高分辨率分析发现,R-P312*(排除R-L21和R-Z56亚型)在葡萄牙频率高达43%,而R-L21在英国集中分布(37%),R-Z56则在意大利更常见(19%)。这些精细地理差异为欧洲人口史研究提供了新线索。技术对比显示,WGS数据能检测到更多稀有单倍群——比利时和瑞典样本中分别鉴定出209和376个独特单倍群,远超靶向测序技术的分辨率。
在讨论部分,作者强调UYSD的创新性在于解决了三大痛点:首次建立跨技术平台的标准化数据管道,开发面向科研社区的开放投稿系统,以及实现与自动化分析工具Yleaf v3的无缝对接。尽管当前数据仍以欧洲为中心(占样本60%),但平台设计支持持续扩展,未来纳入更多非欧种群数据后将能揭示更精细的全球遗传图谱。对于法医学应用,该数据库可提升Y-SNP在生物地理祖先推断中的准确性;在人类学研究方面,则有助于追踪历史迁徙事件如新石器时代农民扩散路线。
这项发表于《European Journal of Human Genetics》的研究标志着Y染色体研究进入大数据时代。通过将分散的"数据孤岛"转化为共享资源,UYSD不仅填补了Y染色体领域长期缺乏统一数据库的空白,更为跨学科合作搭建了桥梁。随着更多研究团队的参与,这一平台有望成为解密人类父系遗传史的钥匙,从分子层面重构我们的共同过去。
生物通微信公众号
知名企业招聘