比利时弗兰德斯地区首个包含完整线粒体基因组的大规模人群汇编
《Forensic Science International: Genetics》:The first population scale compendium of complete mitochondrial genomes from Flanders, Belgium
【字体:
大
中
小
】
时间:2025年11月01日
来源:Forensic Science International: Genetics 3.2
编辑推荐:
弗拉芒德地区264名个体完整线粒体基因组数据首次公开,为2024年新法规提供法医级参考数据库。结果显示平均差异27.3,随机匹配概率0.0042,与邻近欧洲人口遗传亲和度高,并与中世纪古基因组保持连续性
这项研究主要关注比利时北部弗拉芒地区的人群,通过收集264名具有母系血统的个体的完整线粒体基因组数据,填补了该地区线粒体DNA参考数据的空白。线粒体DNA(mtDNA)在法医学、人类识别和群体遗传学中扮演着重要角色,尤其是在处理高度降解的样本时,如法医案件或考古遗骸。这是因为线粒体DNA在细胞中存在多个拷贝,其数量远高于二倍体核DNA,这显著提高了DNA提取的成功率。此外,线粒体DNA的母系遗传特性以及缺乏重组现象,使其成为追踪家族血统、研究人群历史和推断过去社会结构的重要工具。
然而,目前大多数线粒体基因组参考数据集仍然局限于控制区(CR)序列,而这些序列在区分个体方面的能力有限。特别是在比利时,尽管2024年新颁布的国家立法鼓励在家族搜索中使用线粒体DNA和Y染色体标记(比利时皇家法令,2024年4月),但全面的线粒体基因组参考数据仍然较为稀缺。为了弥补这一缺陷,研究人员创建了一个新的法医学级数据集,包含了264名弗拉芒个体的完整线粒体基因组。这些个体的母系血统通过经过验证的家谱记录得以确认,这些记录可以追溯到1750年之前。研究结果表明,该数据集涵盖了252个独特的单倍型,平均成对差异为27.3,随机匹配概率为0.0042,显示出与欧洲其他高质量数据集相当的法医学分辨能力。单倍群H、U和T在弗拉芒地区占据主导地位,这与欧洲广泛观察到的模式一致,同时聚类分析显示该地区与邻近的西欧人群存在密切的遗传亲缘关系。
此外,该研究还比较了中世纪的古代基因组,发现弗拉芒地区的母系血统在历史时期内具有显著的连续性。这些数据大大扩展了弗拉芒地区的线粒体参考数据,提供了一个基于本土母系血统的高质量资源,适用于法医学应用、遗传家谱分析和微观地理人群研究。研究强调了线粒体DNA在法医学中的重要性,尤其是在处理复杂案件时,完整的线粒体基因组数据可以提供更准确的个体识别信息,同时增强对人群结构的理解。
弗拉芒地区是比利时北部的重要区域,具有重要的人口和历史意义。该地区的人口规模约为680万,面积为13,626平方公里(Statbel,2024),是欧洲人口密度和城市化程度最高的地区之一。这种高度城市化的情况可以追溯到中世纪晚期,当时弗拉芒地区是欧洲经济和文化的核心,拥有欧洲阿尔卑斯山以北最大的城市之一,并促进了原始资本主义的诞生。历史上,该地区一直是各种移民运动的交汇点,从当地的铁器时代凯尔特人被罗马帝国统治开始,之后随着西罗马帝国的崩溃,该地区一度荒废,罗马-高卢人口可能与随后迁入的日耳曼人发生了混合。在中世纪晚期和后期,弗拉芒地区的文化和经济繁荣吸引了广泛的大陆人口流动,这些历史因素可能对当前的遗传格局产生了影响。
尽管弗拉芒地区拥有丰富且动态的人口历史,但其遗传构成仍然相对研究不足。目前,常染色体数据的分析仅限于98名个体的研究,该研究揭示了主要的西北欧遗传特征以及更精细的区域结构。另一项研究结合了MinE ALS联盟数据和荷兰的数据,显示了低地国家从北到南的渐变遗传模式。一些Y染色体研究,包括对270名个体的高分辨率全Y染色体分析,发现了一系列典型的西欧单倍群,同时也识别出一些频率较低的单倍群,主要与南欧和非洲有关,这可能反映了古代和历史时期的移民活动。
与Y染色体研究相比,弗拉芒地区的线粒体DNA数据仍然非常有限。目前,仅有一个法医学级的数据集被包含在EMPOT数据库中,但并未发表在同行评审的期刊上。该数据集包括104名个体,仅限于对高变区I和II(HVR-I/II)的测序,覆盖了控制区(D-loop)中的608个碱基对,而整个线粒体基因组长度为16,569个碱基对。这种有限的数据不足以全面反映该地区的线粒体多样性,也无法在法医学调查中提供足够的区分能力。这种限制在2024年比利时立法允许基于线粒体DNA的家族搜索和通过INTERPOL I-Familia及Y染色体分析进行国际数据库搜索的背景下显得尤为重要。
为了应对这一数据缺口,研究人员展示了来自弗拉芒地区264名个体的全新、全面的完整线粒体基因组数据集。本研究的目标是刻画弗拉芒人群的母系遗传多样性,并为法医学和群体遗传学研究提供一个可靠、具有代表性的参考数据集。通过扩展现有线粒体DNA数据集的规模和分辨率,这项工作提高了基于线粒体DNA的识别准确性,并为理解弗拉芒地区的人口结构提供了新的视角。这些数据不仅对法医学领域具有重要价值,也为研究该地区的人口历史和遗传多样性提供了坚实的科学基础。
研究还强调了线粒体DNA在法医学中的应用潜力。由于线粒体DNA的高拷贝数量和母系遗传特性,它在处理降解样本时具有显著的优势。例如,在法医案件中,即使样本受到污染或降解,线粒体DNA仍然能够提供可靠的遗传信息。此外,线粒体DNA的缺乏重组特性使其在追踪家族血统时更加稳定和准确。然而,传统的法医工作往往依赖于Sanger测序技术对非编码控制区(特别是HVR I-III)的测序,这种方法虽然准确可靠,但测序成本高、耗时长,且难以扩展到大规模的人群数据库。因此,研究人员采用了新一代测序(NGS)技术,能够高效地对完整线粒体基因组进行测序,从而提供更全面的群体多样性数据,提高法医匹配统计的区分能力和可靠性。
为了确保数据集的质量,研究人员进行了全面的质量评估。在过滤之前,PCR重复序列占总全基因组原始读数的平均比例为12.6%(表S1)。样本的平均GC含量为44.4%,平均映射质量为56.3,这些指标均表明测序质量较高。映射效率接近1,达到0.998,个体平均有18,272个读数映射到线粒体基因组。这些数据表明,研究人员在测序过程中采用了高质量的技术和方法,确保了数据的准确性和可靠性。
此外,研究人员还对数据集的构建过程进行了详细描述。该项目是名为MamaMito的公民科学项目的一部分,该项目中超过7800名弗拉芒个体通过广泛的档案研究记录了他们的母系血统。个体被招募进行DNA采样,前提是他们的母系血统可以可靠地追溯到1750年之前,且最早的祖先出生于当前的弗拉芒地区。为了确保地理分布的平衡,研究人员还根据其他因素进行了额外的选择。这些措施确保了数据集的代表性,使其能够准确反映弗拉芒地区的母系遗传多样性。
研究还探讨了弗拉芒地区与其他地区的遗传关系。通过聚类分析,研究人员发现弗拉芒地区与邻近的西欧人群存在密切的遗传亲缘关系,这可能反映了历史上的人口流动和混合。此外,与中世纪的古代基因组进行比较,研究人员发现弗拉芒地区的母系血统在历史时期内具有显著的连续性,这可能表明该地区的遗传结构在较长时间内保持相对稳定。这些发现不仅有助于理解弗拉芒地区的人口历史,也为研究欧洲其他地区的遗传多样性提供了参考。
最后,研究总结了其主要贡献。通过创建一个高质量的完整线粒体基因组数据集,研究人员填补了弗拉芒地区线粒体DNA参考数据的空白,提供了可靠的遗传信息。该数据集具有较低的随机匹配概率和较少的单倍型共享,这使得其在法医学和群体遗传学研究中具有重要价值。研究强调了线粒体DNA在法医学中的应用潜力,特别是在处理复杂案件时,完整的线粒体基因组数据可以提供更准确的个体识别信息。同时,该数据集也为研究弗拉芒地区的人口结构和遗传多样性提供了新的视角,有助于理解该地区的历史和文化背景。
总体而言,这项研究不仅为法医学领域提供了重要的参考数据,也为群体遗传学研究提供了新的资源。通过结合公民科学项目和先进的测序技术,研究人员成功构建了一个全面、高质量的线粒体基因组数据集,有助于提高法医学调查的准确性,同时深化对弗拉芒地区和欧洲其他地区遗传结构的理解。这些数据对于研究欧洲人口历史、追踪家族血统以及分析微观地理人群特征具有重要意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号