区间共识模型:聚合连续有界区间响应的新方法

《Psychometrika》:The Interval Consensus Model: Aggregating Continuous Bounded Interval Responses

【字体: 时间:2025年11月05日 来源:Psychometrika 3.1

编辑推荐:

  本文推荐一种创新的区间共识模型(ICM),该模型扩展了文化共识理论(CCT),用于从连续有界区间响应中估计潜在共识区间。研究通过贝叶斯层次建模方法,解决了传统点共识模型在风险评估、语言量化词解释等需要区间共识的场景中的局限性。仿真研究表明ICM在估计偏差和均方误差上均优于简单均值和中位数方法,实证分析进一步验证了模型在语言量化词判断中的有效性。该模型为心理学、风险评估等领域的区间数据聚合提供了新工具。

  
在日常生活中,我们经常遇到需要群体共同判断的情况,比如专家团队评估网络安全风险,或者普通人理解"可能"、"经常"这类模糊的概率词汇。这些判断往往不是简单的对错问题,而是一个合理的数值范围。传统的文化共识理论(Cultural Consensus Theory, CCT)主要关注点状真理的估计,但在许多实际应用中,单一的"正确点"可能无法充分捕捉群体的共识,区间形式的共识反而更能反映现实中的不确定性。
以往的研究已经开发了多种共识模型来处理不同类型的响应格式,从最初的二分响应到连续响应,再到地理坐标的二维估计。然而,当需要估计的是一个区间而非单点时,现有模型就显得力不从心。例如,在网络安全风险评估中,专家可能需要给出一个风险概率的范围;在理解语言量化词时,"可能"对应的概率区间可能比单一数值更能反映语言的模糊性。这种区间响应格式能同时捕捉个体内部的不确定性和个体之间的差异性,但如何科学地聚合这些区间响应,估计出代表群体共识的区间,一直是个挑战。
针对这一问题,马堡大学的研究团队在《Psychometrika》上发表了题为"The Interval Consensus Model: Aggregating Continuous Bounded Interval Responses"的研究,提出了区间共识模型(Interval Consensus Model, ICM),为区间数据的聚合提供了新的解决方案。这一模型不仅能够估计潜在的共识区间,还能评估受访者的专业水平和项目的可辨别性,为心理学、风险评估、语言理解等领域的应用提供了有力工具。
研究人员采用了贝叶斯层次建模框架,核心技术创新在于将等距对数比(Isometric Log-Ratio, ILR)变换作为连接函数,将二维正态分布模型与观察到的有界区间响应相连接。这种方法能够恰当地处理区间响应的组成性质,同时考虑了区间位置接近响应尺度边界时对区间宽度的缩放效应。通过仿真研究,团队系统评估了ICM在不同受访者和项目数量条件下的表现,并与简单的均值、中位数方法进行了对比。实证部分重新分析了Kloft和Heck(2024)收集的语言量化词判断数据,验证了模型的实际应用价值。
模型构建与理论创新
ICM的核心是将区间响应视为一个三成分的复合数据:下界、宽度和上界到尺度上限的距离。通过等距对数比变换,将这些有界响应映射到无界空间,从而可以应用二元正态分布进行建模。模型包含受访者的专业水平参数(Eiloc和Eiwid)、项目的可辨别性参数(λjloc和λjwid),以及反映个体响应偏差的参数。这种设计使得模型能够区分受访者的专业水平,对一致性高的受访者赋予更高权重,从而提高共识区间估计的准确性。
仿真验证与性能评估
研究团队设计了全面的仿真研究,系统评估了ICM在不同条件下的表现。结果表明,在所有测试条件下,ICM在共识区间位置和宽度的估计上都显著优于简单的均值和中位数方法。即使在小样本情况下(如10个受访者、5个项目),ICM仍能保持良好的估计性能,绝对偏差仅为真实标准差的很小比例。随着受访者数量的增加,模型性能进一步提升,当受访者从10人增加到50人时,绝对偏差大约减半。项目数量的增加也对性能有积极影响,但效果不如增加受访者数量明显。
实证应用与结果分析
在语言量化词的实证分析中,ICM成功估计了16个语言量化词(如"很少"、"经常"等)的共识区间。对于控制项"绝无可能"、"五五开"和"总是",模型估计的共识区间与预期高度一致:"绝无可能"接近0%,"总是"接近100%,"五五开"则精确集中在50%附近且区间宽度很小。对于模糊性较高的词汇如"可能",模型估计的共识区间较宽,反映了这些词汇在使用中的不确定性。与简单中位数方法相比,ICM的估计更能代表大多数受访者的判断,对异常值的敏感性更低。
参数估计与诊断价值
ICM提供的参数估计具有重要的诊断价值。受访者专业水平在区间位置和宽度维度上的相关性为0.63,表明在两个维度上表现一致的受访者确实具有更高的专业性。项目可辨别性参数的分析显示,控制项具有较高的位置可辨别性和较低的宽度可辨别性,这与这些词汇含义明确的特点一致。模型还能自动识别并降低低专业水平受访者的权重,无需依赖主观的筛选标准。
区间共识模型的提出为处理区间响应数据提供了系统的方法论框架。通过将文化共识理论扩展到区间数据领域,该模型不仅解决了点共识模型的局限性,还为风险评估、语言理解等需要区间共识的场景提供了科学工具。模型的优势在于能够同时估计共识区间、受访者专业水平和项目特性,为研究者提供全面的分析视角。未来研究可进一步探索模型在多层次共识估计、点真理区间估计等方向的扩展,推动区间数据分析方法的发展与应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号