《Scientific Reports》:Hallmarks of social action in the vocal turn-taking of wild common marmosets (Callithrix jacchus)
编辑推荐:
摘要:对话性轮替(conversational turn-taking)——即个体间有序交换信号——被认为是人类交流与语言的重要组成部分。以往关于叫声轮替的比较研究常局限于少数模式物种,通常仅考察单一鸣叫类型、人类对话轮替的部分特征或圈养动物,从而限制了对轮替
摘要:对话性轮替(conversational turn-taking)——即个体间有序交换信号——被认为是人类交流与语言的重要组成部分。以往关于叫声轮替的比较研究常局限于少数模式物种,通常仅考察单一鸣叫类型、人类对话轮替的部分特征或圈养动物,从而限制了对轮替复杂性及其演化轨迹的更广泛理解。本研究表明,野生普通绒(Callithrix jacchus)会进行结构化叫声交换,其部分基本特征与人类对话性轮替共享。研究人员分析了1,245次自然叫声互动,发现个体能够产生由匹配鸣叫类型(matching call types)构成的多轮交换。绒猴与群内成员及邻群互动时使用不同叫声;这些互动具有灵活的轮次组织、反复出现的鸣叫序列、较短的轮次间隔(约1,300 ms)以及涉及特定个体的结构化参与框架(participation framework)。综上,本研究凸显了野生普通绒叫声互动的复杂性,提供了对整个叫声库(coordination across the whole vocal repertoire)协调性的更广阔视角,并提示人类对话性轮替的元素可能存在于该物种中,且至少部分与其他灵长类共享。
论文解读:
《Scientific Reports》刊登的此项研究以野生普通绒(Callithrix jacchus,common marmoset)为对象,探讨其叫声轮替(vocal turn-taking)是否具备与人类对话(conversation)中社会互动(social action)相似的典型组织特征,以检验"互动引擎假说(Interaction Engine hypothesis)"所主张的人类交流基础能力在灵长类中的演化深度。既往对非人灵长类叫声轮替的研究多局限于圈养环境下的单一鸣叫类型(如PHEE鸣叫),且仅考察邻接对(adjacency pair)或短间隔等个别特征,缺乏对全叫声库在自然社交情境下(含群内与群间互动)综合轮替结构的系统描述。普通绒具合作育幼(cooperative breeding)体系及复杂叫声系统,是探究语言前驱能力的理想模型,但此前数据均来自圈养对(pair),野外系统证据缺失。为此,研究人员在巴西卡廷加(Caatinga)植被区对4群共25只野生普通绒(观察亚成体及成体18只)进行焦点动物取样(focal animal sampling),共采集540小时观测录音,经ELAN标注筛选出1,245次有效双向叫声互动,从鸣叫类型多样性、社交对象(群内intra-group vs群间inter-group)、轮替组织灵活性(flexibility of turn-taking organization)、邻接对样序列(adjacency pair-like sequences)、时间关系(temporal relationships)及参与框架(participation framework)四方面评估其与人类对话特征的相似性。
主要关键技术方法:研究人员于2022年7月至2023年3月在巴西Baracuhy生物野外站对4群野生普通绒(亚成体及成体共18只,已习惯化)进行焦点动物取样,用Sennheiser MKE 600麦克风及Tascam DR-100 mkII录制音频(16-bit,48 kHz),以10秒阈值定义轮替(前一信号结束至后一信号开始≤10 s)。在ELAN 6.7中对叫声类型(单音节syllable、序列鸣叫sequence call、复合鸣叫compound call如PHEE、TRILL、TWITTER、CHIRP、SUBMISSIVE CRY等)、发起者/回应者身份、轮次转换次数进行编码。采用广义线性混合模型(GLMM)、马尔可夫链(Markov chain)分析轮替序列结构,多重差异搭配分析(Multiple Distinctive Collocation Analysis, MDCA)检验鸣叫搭配吸引/排斥,线性混合效应模型(LME)比较间隙(gap)、暂停(pause)与阶段回应(phase response)时长,并通过1,000次随机置换模拟检验多轮转换频次显著性。编码一致性检验Cohen's κ分别为0.97(个体ID)和0.89(鸣叫类型),间隙ICC=0.84。
研究结果:
灵活性 of turn-taking organization(轮替组织的灵活性):研究人员分析重复信号(同型坚持persistence vs换型阐述elaboration)及轮次转换次数发现,重复类型与重复次数均不影响获得回应的概率(p=0.465;p=0.704)。初始信号(S1)最常转为回应(R1,48%)或终止(41%),R1后最常见为终止(77%);多轮交换可延续至≥3轮。单轮转换在群内更常见(79.8% vs群间69.1%),而2轮及以上转换在群间互动中比例更高,且各轮次转换频次均显著高于随机期望(p=0.001),表明绒猴叫声轮替具灵活可调结构,非仅限于单次交换。
Adjacency pair-like sequences(邻接对样序列):经MDCA分析,相同鸣叫类型间呈显著吸引——ALARM-ALARM(强度值24, p<0.001)、TRILL-TRILL(14, p<0.001)、PHEE-PHEE(8, p<0.001)、TWITTER-TWITTER(6, p<0.001);CHIRP与SUBMISSIVE CRY也呈正搭配(11, p<0.001)。PHEE鸣叫回应时常匹配相同音节数(单音节PHEE-单音节PHEE强度值5.1, p<0.01;双音节亦然)。PHEE-TRILL与TRILL-PHEE呈排斥(强度值-7)。说明绒猴存在非随机的鸣叫-回应序列,具邻接对样组织特征。
Temporal relationships(时间关系):所有轮次间隙(gap)中位数为约1,300 ms(范围-2,119~9,975 ms),仅3%出现重叠(overlap)。鸣叫配对类型显著影响间隙——TRILL-TRILL与TWITTER-TWITTER间隙显著短于PHEE-PHEE(均p<0.001),群归属无显著影响(p>0.40),表明存在跨社交情境的稳定响应计时规则及回避重叠倾向。
Participation framework(参与框架):间隙(gap)中位数约1,300 ms,个体内暂停(pause)中位数约5,470 ms,阶段回应(phase response,A-B-A模式中A两叫间含B插入)中位数约7,000 ms。三者差异极显著(p<0.0001),gap显著短于pause与phase response,phase response又显著长于pause,符合人类对话中turn-taking时序区分模式,反映绒猴对特定互动伙伴的有向性参与。
讨论与结论翻译:野生普通绒展现出以时间规律性及跨多种鸣叫和社会情境的结构化协调为特征的轮替系统,包括快速轮转换、较一致的组间间隙、非随机鸣叫-回应序列及特定个体参与,部分特征与鸟类、其他灵长类及人类对话共有。尽管群间互动中可出现多轮交换(可能因距离远、熟悉度低),多数仍为单轮交换后终止。研究表明普通绒叫声轮替并非简单反射性反应,而具与人类社会互动引擎要素相呼应的组织性。此类结构化时间协调可能是复杂社会交流共有特征,为对话轮替演化根源提供比较证据。局限性包括未系统记录可视接触与行为背景、部分互动对象未完全确认。结论:野生普通绒(common marmoset, Callithrix jacchus)表现出一种轮替系统,其特征是在多种鸣叫类型和社会情境下具有时间规律性与结构化协调。这些模式即便在群间遭遇中也持续存在,提示超越群内互动考察之重要性。结合快速轮转换、跨群体相对一致的间隙区间及非随机鸣叫-回应序列,本研究支持人类对话性轮替之元素可在此物种中找到,并至少部分与其他灵长类共享。