统计错误挑战多式综合语演化主张:方法论缺陷与重估结果

【字体: 时间:2025年10月09日 来源:Proceedings of the National Academy of Sciences 9.4

编辑推荐:

  来自多机构的研究团队针对Bromham等人关于多式综合语演化生态的统计方法展开复核,发现其贝叶斯模型平均(BMA)误用为频率模型平均(FMA)、空间滤波(ESF)算法存在三重缺陷,导致关键指标"小语系"显著性消失。研究通过BIC校正与混合效应模型重构,证实多式综合语分布特征主要受系统发育与地理聚类影响,推翻原研究的"长孤立谱系"理论。

  
最新研究揭露了关于多式综合语演化生态的重要统计缺陷。原声称多式综合语倾向于出现在小种群、低语言接触和高系统发育隔离环境的结论,被证明建立在有问题的统计方法之上。
研究团队发现原分析存在两大核心问题:首先,所谓的贝叶斯模型平均(Bayesian Model Averaging, BMA)实则采用了频率学派模型平均(Frequentist Model Averaging, FMA),错误地使用最大似然估计(MLE)计算后验模型概率(PMP)。这种未考虑模型复杂度的做法导致过拟合,使所有后验包含概率(PIP)虚高至0.5以上。经贝叶斯信息准则(BIC)校正后,仅L1.pop(母语人口)、Bordering languages/km(单位面积边界语言数)和Altitude(海拔)保持PIP>0.5,而原研究核心指标"Small Family"(小语系)的PIP骤降至0.06以下。
其次,在控制系统发育和地理关联性的空间滤波(ESF)方法中存在三重错误:特征向量选择标准误用、归一化因子计算错误,以及多矩阵协同处理不当。当采用正确的混合效应模型(包含语言家族和亚区域随机效应)后,模型拟合优度显著提升(ΔBIC>860),固定效应要么失去显著性要么效应方向逆转。方差分解显示系统发育和地理结构解释了99.5%的变异,而原研究关注的固定效应仅贡献不足4%的解释力。
这些发现表明,多式综合语的空间分布模式主要源于历史谱系关系和地理聚集效应,而非原研究声称的社会生态因素。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号