罕见单亲谱系揭示意大利格列恰萨伦蒂纳语言飞地基因库中的外部祖先成分

《Scientific Reports》:Rare uniparental lineages reveal external ancestries in the gene pool of the Italian linguistic enclave of Grecìa Salentina

【字体: 时间:2025年12月09日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对意大利南部希腊语飞地格列恰萨伦蒂纳(Grecia Salentina)的遗传起源争议,通过全基因组测序分析27名当地居民的线粒体DNA(mtDNA)和Y染色体(NRY)变异。研究发现该群体存在特有的单倍群谱系(如mtDNA的K1b1c、J1和NRY的J2a、R1a),表明其基因库受到来自巴尔干半岛和近东地区的双性别移民影响,且社区长期保持遗传隔离。该成果为语言-基因协同进化理论提供了微观地理尺度的重要证据,发表于《Scientific Reports》。

  
在意大利靴形半岛的鞋跟位置,有一片被称为“格列恰萨伦蒂纳”(Grecia Salentina)的奇特区域。这里的居民世代相传一种古老的希腊方言——格里科语(Griko),仿佛在地中海沿岸镶嵌了一颗希臘語言的文化孤岛。几个世纪以来,语言学家们一直在争论:这种方言究竟是公元前8世纪古希腊殖民者留下的“活化石”,还是中世纪拜占庭帝国统治时期(公元9-11世纪)希腊移民带来的语言遗产?由于希腊语在意大利南部留下了多层语言印记,并与拉丁语、罗曼语方言不断交融,仅凭语言学证据难以追溯其确切起源。
正当语言学陷入僵局时,遗传学为破解这一谜题提供了新的视角。2025年发表于《Scientific Reports》的一项研究,通过分析格列恰萨伦蒂纳居民的基因密码,首次揭示了这片语言飞地背后隐藏的人口迁移史。研究人员提出:如果语言的传入伴随着大规模人口迁移,那么现代居民基因中应当保留着特定祖先群体的遗传信号。而母系遗传的线粒体DNA(mtDNA)和父系遗传的Y染色体(NRY)作为“遗传计时器”,能够精准追溯女性与男性祖先的迁徙路径。
为验证这一假说,由意大利多所高校组成的联合团队对27名格列恰萨伦蒂纳原住民进行全基因组测序,重点解析了mtDNA和NRY的完整变异谱。通过与其他53个欧亚人群的遗传数据对比,他们发现了一些令人惊讶的线索——这些线索不仅指向了外部祖先的来源,还暗示了这个社区数百年来维持文化认同的生物学基础。
关键技术方法
研究团队分两阶段(1994年与2019年至今)采集格列恰萨伦蒂纳居民口腔拭子样本,经伦理审查后筛选27例进行全基因组测序。利用Illumina平台构建文库,以hg38为参考基因组进行比对,通过Strelka检测变异。mtDNA单倍群用Haplogrep3结合PhyloTree分类,Y染色体单倍群通过ISOGG数据库注释。采用主成分分析(PCA)和Fst统计比较人群遗传结构,基于最大简约法构建系统发育树追溯特定谱系起源。
研究结果
线粒体DNA
在27例样本中,研究者识别出9例属于单倍群H(32%),其频率分布与意大利本土背景一致。但更引人注目的是三个“外来信号”:单倍群N1b1a、K1b1c和J1的合计频率高达37%,远超周边意大利人群。
  • N1b1a:两个样本均属该谱系。其中样本16携带195C变异,但缺乏姐妹支系标志性突变,形成格列恰萨伦蒂纳特有分支;样本24与欧美样本共享12007A变异,但独有143A变异,提示近期分化。系统发育分析显示该谱系可能在新石器时代后经巴尔干传入。
  • K1b1c:5例样本(18.5%)属于K1b1c7亚型,全部携带14258A变异(未见於其他地区样本),且三例序列完全一致。与古代DNA数据对比表明,该谱系可能追踪新石器时代沿地中海航路的移民,并在格列恰萨伦蒂纳发生近期辐射。对69名卡拉布里亚希腊语人群(Grecanici)的检测显示该谱系完全缺失,强化其地域特异性。
  • J1:三例样本分属不同支系。样本1的J1c9b型与普利亚大区样本共享951A变异,但独有6050C;样本21的J1c10型最近缘个体来自近东(贝都因人);样本9的J1d型与中东、北非序列聚簇,但拥有5个私有变异。
    主成分分析显示,格列恰萨伦蒂纳mtDNA与中意大利、东巴尔干人群重叠,而Fst值证实其与北非、西北欧人群存在显著分化。
Y染色体
20名男性样本中鉴定出16种单倍群,单倍群J2a(40%)和R1a(15%)频率异常偏高。
  • J2a:8例样本均属J2a-M410(xM67)分支,缺乏意大利常见的M67变异。精细系统发育分析发现多条新分支:
    • 样本1和6属J2a-L397支系,其中样本1未携带Z423等3个衍生 allele,定义全新“格列恰萨伦蒂纳特有”分支;样本6与希腊样本共享分支58部分突变。
    • 样本12和24属J2a-M319分支,与土耳其、黎巴嫩、希腊样本共享13个变异。
    • 其余样本(J2-M92、J2-L26*等)均呈现与黎巴嫩、希腊或中东的分子亲和性,节点年龄上限为6.3千年。
  • R1a:3例样本均属R1a-M558分支的GML6亚型,携带三个新变异定义全新分支。最近缘序列来自希腊和中亚,提示与巴尔干斯拉夫人群的关联。
  • 其他单倍群:E-V13(常见于巴尔干)、R1b各支系(代表意大利本土背景)频率较低。
    PCA显示格列恰萨伦蒂纳Y染色体与南意大利、克里特岛人群聚类,而与巴尔干人群因I-P37单倍群差异而分离。Fst分析揭示其与北意大利、西欧人群显著分化。
讨论与结论
本研究首次通过高分辨率遗传学证据证明,格列恰萨伦蒂纳希腊语社区存在独特的基因库结构。mtDNA与NRY均检测到外部祖先信号,表明社区形成涉及双性别移民,而非单一性别的军事征服或贸易往来。单倍群K1b1c、J2a、R1a等谱系的系统发育特征,既兼容希腊殖民时期(公元前8-6世纪)的移民,也无法排除拜占庭时期(公元9-11世纪)来自帝国东疆的贡献。例如,J1d型mtDNA和部分J2a型Y染色体直接指向中东起源,可能反映拜占庭时期的人口流动;而R1a-GML6则更可能关联斯拉夫人群的迁移。
尤为重要的是,这些“外来”谱系在周边意大利人群中罕见,表明格列恰萨伦蒂纳社区长期保持遗传隔离,通过内婚制限制了基因交流。这种遗传隔离与历史上10个希腊语市镇间紧密的社会网络相吻合,共同维系了语言与文化的传承。
该研究为“基因-语言共进化”理论提供了微观地理尺度的实证。尽管语言与人口的迁移可能并非完全同步,但格列恰萨伦蒂纳案例强烈提示,希腊语在南意大利的存续很可能以特定移民群体的生物学延续为基础。未来通过对比卡拉布里亚的格里科语人群、阿尔巴尼亚语系的阿尔贝雷谢人(Arbereshe)及莫利塞的南斯拉夫语人群,可进一步验证语言飞地形成过程中遗传与语言因素的耦合机制。这项研究不仅解开了南意大利希腊语社区的起源谜团,更为理解人类文明史上语言与基因的复杂互动提供了新的范式。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号