几何形态测量学与机器学习耦合在更新世晚期和近现代人群下颌骨性别估计中的应用与评估

《Scientific Reports》:Coupling geometric morphometrics and machine learning for mandibular sex estimation in Late Pleistocene and Late Modern populations

【字体: 时间:2025年12月20日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对考古和法医人类学中骨骼遗存性别估计面临的保存不完整和主观性难题,创新性地将几何形态测量学(Geometric Morphometrics, GM)与机器学习(Machine Learning, ML)相结合,聚焦下颌骨形态分析。研究人员利用葡萄牙路易斯·洛佩斯(Luis Lopes)已知性别现代样本训练模型,并在同一人群及年代、地理距离遥远的苏丹杰贝尔萨哈巴(Jebel Sahaba)晚更新世考古样本中进行验证。结果显示,GM-ML方法在群体内性别分类准确率高达90%,但在跨群体应用时准确性显著下降至约60-63%,凸显了群体间下颌骨尺寸和形状差异对模型泛化能力的重大影响。该研究为开发更可靠的骨骼性别估计方法提供了重要见解,并警示了在跨时空人群研究中直接套用模型的局限性。

  
在法医人类学、生物人类学和考古学研究中,准确估计个体性别是进行个体生活史重建、分析古代社会结构(如丧葬行为、饮食、活动模式等差异)的基础。然而,这项关键任务常常面临巨大挑战。对于考古遗址出土的人类遗骸,骨骼的保存状况往往不理想,破碎和残缺是常态,使得依赖于完整骨骼(如骨盆和头骨)的传统形态学性别估计方法难以施展。虽然生物分子方法(如古DNA和古蛋白质组学)能提供高精度的结果,但它们具有破坏性、成本高昂且同样受制于生物分子的保存状况。因此,基于骨骼形态的性别估计目前仍是应用最广泛且最可行的途径。
下颌骨(俗称“下巴骨”)因其坚固、易于保存且在研究中常被用于分析人群历史和饮食适应等特点,成为一个有潜力的替代对象。但当下颌骨与其他骨骼分离时,其性别估计的可靠性存在不确定性,限制了其在复原古代人口信息方面的应用。为了提升下颌骨性别估计的客观性、准确性并降低观察者间误差,葡萄牙阿尔加维大学的Ricardo Miguel Godinho等研究人员在《Scientific Reports》上发表了一项研究,他们将先进的几何形态测量学(Geometric Morphometrics, GM)与机器学习(Machine Learning, ML)技术相结合,旨在评估这种方法在不同人群中的有效性和局限性。
为了回答这些问题,研究人员开展了一项严谨的分析。他们选取了两个时空跨度极大的样本:67个来自葡萄牙里斯本“路易斯·洛佩斯”(Luis Lopes)已知性别和身份的现代骨骼收藏品(近现代人群),以及18个来自苏丹“杰贝尔萨哈巴”(Jebel Sahaba)遗址的晚更新世(旧石器时代晚期)考古样本。所有下颌骨均通过表面扫描获取三维模型,并采集了21个解剖学标志点(Landmarks, LMs)的三维坐标。利用GM技术,研究人员在排除了大小差异的“形状”(shape)空间和包含了大小信息的“形态”(form)空间分别进行了分析,以探究性别和人群间的差异。随后,他们使用现代样本的大部分数据(70%)训练了11种不同的机器学习算法(如随机森林RF、支持向量机SVM、逻辑回归LGR等),并用剩余的现代样本(30%)进行模型性能的初步测试。最终,将这些训练好的模型应用于杰贝尔萨哈巴考古样本,将其性别预测结果与该遗址先前通过多骨骼区域(骨盆、颅骨等)形态学分析得出的性别评估进行对比,以检验GM-ML方法在跨人群应用中的可靠性。
2.1 GM based morphological analysis
几何形态测量学分析结果显示,在两个人群(葡萄牙近现代和苏丹晚更新世)内部,男性下颌骨的 centroid size( centroid size ,一种反映整体大小的指标)均显著大于女性,证实了尺寸上的性二态性。然而,杰贝尔萨哈巴人群的下颌骨整体上比近现代葡萄牙人群更大,其女性个体的大小甚至与葡萄牙男性个体相当,这表明存在明显的群体间大小差异。在形态上,统计检验(PERMANOVA)表明,在包含了大小信息的“形态”空间,所有分组(两人群的男女)间均存在显著差异;而在仅关注纯形态的“形状”空间,只有葡萄牙人群内部存在显著的性别差异,杰贝尔萨哈巴人群内部的性别差异则不显著。主成分分析(Principal Component Analysis, PCA)图显示,在“形态”空间,主成分1(PC1)能在一定程度上区分同一人群内的性别(男性更粗壮),而在“形状”空间,PC1主要区分的是两个人群本身(杰贝尔萨哈巴样本更粗壮),群体内的性别区分则依赖于贡献率较低的主成分。这些发现表明,本研究中所观察到的性二态性主要源于尺寸上的差异。
2.2 Machine Learning
机器学习模型的表现取决于所使用的主成分(Principal Components, PCs)数量。当使用能够解释数据总方差90%的PCs时,模型在内部测试(葡萄牙样本)中达到了最佳平衡。在此设置下,基于“形态”空间的模型(平均准确率约90%)普遍优于基于“形状”空间的模型(平均准确率约81%),其中随机森林(Random Forest, RF)算法在“形态”空间达到了95%的最高准确率。这进一步印证了尺寸信息对于区分性别的重要性。然而,当将训练好的模型应用于地理和年代遥远的杰贝尔萨哈巴考古样本时,分类准确性显著下降。基于“形态”空间的模型平均匹配率约为63.13%,基于“形状”空间的模型平均匹配率约为60.10%。一个突出的现象是,基于“形态”的模型存在将考古样本中的女性错误分类为男性的明显倾向,这很可能是因为杰贝尔萨哈巴女性下颌骨的尺寸已接近甚至达到葡萄牙男性的水平,导致模型依据尺寸进行判断时产生偏差。尽管有少数模型(如基于径向基函数核的支持向量机SVMr)在特定条件下取得了较高的一致性(最高达83.33%),但总体而言,模型在现代样本上的高准确率并不能很好地预测其在考古样本上的表现,群体间的形态差异是导致跨群体性别估计可靠性降低的主要原因。
3 Discussion
本研究的结果与先前研究一致,确认了下颌骨存在显著的性二态性,并且不同人群之间在下颌骨形态上存在明显差异。GM-ML方法在群体内部的性别估计中展现出极高的潜力,其准确率优于许多传统方法,并且减少了主观性。然而,将基于现代特定人群(如葡萄牙人群)开发的模型直接应用于形态学上差异巨大的考古人群(如粗壮的晚更新世杰贝尔萨哈巴人群)时,其可靠性会大幅下降。这强烈警示我们,在骨骼性别估计中,参考样本的选择至关重要。使用与目标人群在遗传背景、生活方式、饮食结构上差异过大的参考样本或方法,可能导致系统性的误判,进而影响对古代社会结构(如性别比例)等问题的解读。本研究也存在一些局限性,例如仅使用了一个现代参考人群,未使用半滑动标志点(semi-landmarks)以获取更细致的形态信息,以及考古样本的参考性别本身也可能存在不确定性等。未来研究可纳入更多样化的参考人群,并尝试结合古DNA等独立方法确定的考古样本性别,以开发更具普适性或人群特异性的高精度性别估计方法。
综上所述,这项研究有力地证明了结合几何形态测量学与机器学习的方法在群体内部进行下颌骨性别估计的高效性,为处理碎片化考古遗存提供了强有力的新工具。同时,它也深刻揭示了在跨人群、跨时空的应用中,必须审慎考虑群体间生物学差异所带来的挑战。这一发现不仅对方法学本身有重要意义,也对基于骨骼遗存推论古代人口特征和社会结构的研究提出了重要的警示和指导。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号