从认知不对称性到自然语言处理优化:通过眼动实验量化情感文本处理中的类型-频率交互作用

《Computers in Human Behavior Reports》:From cognitive asymmetries to NLP optimization: Quantifying type-frequency interactions in emotional text processing through eye-tracking experiments

【字体: 时间:2025年08月08日 来源:Computers in Human Behavior Reports 5.8

编辑推荐:

  本研究通过眼动追踪技术,操纵情绪词类型(标签vs.负载)和词频(高低),探讨自然文本阅读中情绪语义的加工差异。实验发现:1)情绪标签词在早期(首次注视时长、单次注视时长)和晚期(总注视时长)均表现出更强的情绪激活和注意力维持;2)词频调节效应因情绪极性而异:正情绪中仅在早期显著,负情绪中在早期和晚期均显著。研究结果为NLP情感分析模型优化提供了认知机制基准,强调词频与情绪词类型的交互作用对语义激活的影响。

  当前的自然语言处理(NLP)情感分析模型在区分直接表达情感含义的词汇(如“悲伤”)与间接表达情感含义的词汇(如“坟墓”)方面存在不足,尽管这两种词汇在语义结构上存在根本差异。本研究通过一个2×2的因子设计,同时操控情感词汇类型(标签型与带情感词汇)和词汇频率(高频与低频),利用眼动追踪技术分析这些变量如何在不同情感倾向下共同塑造情感文本的处理过程。实验一(N=40,积极情感倾向)和实验二(N=40,消极情感倾向)分别探讨了积极和消极情感词汇的处理模式。研究结果揭示了三个关键发现:首先,情感标签词汇在处理各个阶段都引发了更强的情感激活和持续的注意力;其次,频率效应表现出情感倾向依赖性——高频增强了积极标签词汇的语义提取,但降低了消极标签词汇的感知注意力;第三,低频增强了消极标签词汇的情感显著性,同时削弱了积极标签词汇的激活程度。这些发现表明,情感词汇类型和词汇频率通过不同的认知机制共同塑造情感文本的理解。本研究的实证证据为NLP情感分析提供了两个重要的推进:一是证明了情感词汇类型之间的语义区分对于准确的情感建模是必要的,二是提供了认知处理的基准以优化机器学习应用中的情感词汇构建。实验心理学与计算语言学的方法学整合为开发神经学基础的NLP系统提供了新的路径。

情感词汇的语义处理在过去几十年中得到了广泛研究(参见Citron, 2012;Hinojosa等,2020)。大多数研究通过各种任务探讨了情感词汇与中性词汇(中等情感和低唤醒)相比在词汇处理中的优势(例如Barriga-Paulino等,2022;Citron等,2014;Crossfield & Damian, 2021;Kousta等,2009;Kuperman等,2014;Schacht & Sommer, 2009;Vinson等,2014)。例如,在词汇决策任务中,参与者对情感词汇的识别速度和准确性均高于中性词汇,即使在短暂呈现的情况下也是如此。这表明情感词汇的词汇意义可以迅速激活和获取。此外,在快速序列视觉呈现任务中,情感词汇即使与干扰刺激交错,也能被准确识别,与中性词汇形成鲜明对比(Zhang等,2014;Zhao等,2018)。这表明情感词汇的语义激活在有限注意力条件下更为自动和迅速。同样,在掩蔽启动范式中,情感启动词汇对目标词汇的语义启动效应大于中性启动词汇,增强了目标词汇的识别(Spruyt等,2002)。这也确认了情感语义可能在阈下处理中起作用(Gaillard等,2006),有助于词汇识别。此外,即使词汇的语义信息在处理过程中是隐含的(即不需要语义判断),情感词汇(与中性词汇相比)对任务表现的影响更为显著。例如,在点探任务(Sutton & Altarriba, 2011)和斯特鲁普任务(Siakaluk等,2014)中,线索词的情感值被操控,参与者被要求判断线索的位置或颜色。结果表明,参与者对情感词汇的位置比中性词汇更为敏感(Sutton & Altarriba, 2011),并且更难从情感词汇中转移注意力(Siakaluk等,2014)。这表明情感语义的快速激活显著影响了注意力分配,使得捕捉和吸引注意力变得更加容易(Schacht & Sommer, 2009)。这种对情感词汇的注意力偏差还得到了更大的脑波振幅的支持,如EPN(250-300毫秒,Schindler & Kissler, 2016)和LPC(500-700毫秒,Kaltwasser等,2013)。这些发现表明,情感词汇的语义处理激活了这些词汇所承载的情感信息,吸引了更多注意力并促进了词汇访问。

然而,大多数关于情感词汇语义处理的研究集中在使用ERP技术对孤立词汇进行分析(Hinojosa等,2023)。虽然ERP技术能够揭示语义处理的精确时间动态和生理机制(Hinojosa等,2023),但它与真实世界文本的处理方式存在显著差异。ERP技术会破坏文本的连贯性,无法准确反映这些文本的自然处理模式。在自然语言中,大多数语义信息是通过文本传递的,如句子,其中情感词汇通常被嵌入(Scott等,2012)。为了研究情感语义在文本中的处理,有必要将情感词汇嵌入句子中。这种方法可以促进情感语义在自然文本中的编码和整合,并帮助识别读者在处理情感内容时的行为模式。此外,这将有助于优化NLP模型,提高其在预测用户在互联网平台上的偏好方面的准确性(Ka?mierczak等,2024)。

当人们阅读文本时,他们通常会表现出注视行为。这些注视行为可以揭示阅读过程中的行为模式和读者的内部认知过程(Rayner, 1998, 2009)。这种在线注视行为与使用眼动追踪技术相吻合。因此,利用眼动追踪技术探索文本处理不仅能够捕捉自然处理模式并揭示词汇的语义处理,还能够分析在线阅读中的视觉注意力分布(Rayner, 1998, 2009)。这种方法为情感文本处理提供了更生态有效的行为模式(Scott等,2012)。因此,近年来研究人员越来越多地使用眼动追踪技术来研究自然文本阅读中情感词汇的语义处理。然而,这些研究的数量仍少于使用ERP技术对孤立词汇进行处理的研究。大多数研究集中在词汇的言语和情感特征如何影响阅读行为。

Scott等(2012)首次通过将情感词汇嵌入句子中,利用眼动追踪技术揭示了情感词汇对自然文本处理的具体影响。他们通过比较情感和中性词汇在句子阅读中的早期注视指标(首次注视持续时间、单次注视持续时间和注视持续时间)和晚期注视指标(总注视时间)发现,情感处理优势与孤立词汇水平的研究结果一致:情感信息可以快速访问和整合,影响注意力分配。然而,情感词汇在句子中的语义处理受到词汇特征的限制,如词汇频率,表现出情感倾向的不对称性(Scott等,2012)。具体来说,积极词汇表现出比消极词汇更灵活的语义优势,不受词汇特征的限制,情感语义的访问更为迅速。尽管这一发现揭示了自然文本处理中情感词汇的实时影响,但在材料操控方面仍存在局限,因为句子框架并未统一。因此,Yan和Sommer(2015, 2019)在控制句子结构后进一步研究了情感词汇在自然文本中的语义处理。他们的结果不仅支持了情感词汇在句子处理中的语义优势,还揭示了情感信息对文本预览处理的影响。具体来说,消极词汇会吸引读者的注意力,阻碍预览中有用信息的提取。这一发现表明,情感信息在文本理解过程中也具有显著性,使其更加容易获取并占据读者的注意力资源。此外,Sheikh和Titone(2013)操控了词汇的各种语义特征——言语信息(词汇频率)、感觉运动信息(具体性)和情感信息(情感值)——以进一步研究情感词汇对文本处理的影响。他们发现,当词汇尚未通过丰富的言语(频率)或感觉运动(具体性)信息获得处理优势时,情感信息会迅速发挥作用,有助于词汇语义和句子的整合。在这一基础上,Yao等(2024)操控了词汇的图像性(即激发心理图像的难易程度),发现高图像性抽象词汇的情感效应显著大于低图像性词汇。这突显了多通道信息在流畅阅读中激活情感语义的重要性。然而,这些研究在情感语义优势模式上并不一致。Scott等(2012)发现,在文本阅读中,积极词汇相比中性词汇具有更大的语义访问优势,而消极词汇相比中性词汇则没有显著差异。Yan和Sommer(2015, 2019)发现,消极词汇相比中性词汇具有更显著的情感优势,而积极词汇相比中性词汇则没有显著差异,且注视时间较短。然而,其他研究(Sheikh & Titone, 2013;Yao等,2024)表明,无论是积极还是消极词汇,情感词汇在文本阅读中都比中性词汇具有普遍的处理优势,且积极和消极词汇在注视时间上没有显著差异。

情感语义处理模式在文本阅读中的不一致可能是由于未能考虑情感词汇之间的语义差异以及混合不同类型的情感词汇(Betancourt等,2023;Knickerbocker等,2015)。最近的研究表明,情感词汇在情感语义类别中的代表性存在差异(Ferré等,2024)。具体来说,“一些词汇比其他词汇更代表情感语义类别,因此更强烈地传达特定的情感意义”(Ferré等,2024,第745页)。基于这一差异,研究人员将情感词汇分为不同的语义类型:情感标签词汇直接代表特定情感状态或感觉,作为情感的显性标签。这些词汇本质上传达情感意义,并以清晰和直接的方式引发情感体验,如“快乐”、“悲伤”、“愤怒”和“恐惧”。这类词汇通常被视为情感类别的原型表示,与情感的核心语义特征高度一致(Altarriba, 2006;Pavlenko, 2008)。相比之下,情感带入词汇并不直接代表情感状态,而是通过其联想意义引发情感体验。这些词汇因与积极或消极经验、事件或概念的联系而具有情感色彩。尽管它们的语义内容本身并非情感性的,但它们通过内涵引发情感反应,如“失败”、“死亡”、“成功”和“胜利”。在这些情况下,情感共鸣源于这些词汇所携带的语境或概念联想,而不是词汇本身(Altarriba, 2006;Pavlenko, 2008)。虽然两种类型的词汇都包含情感意义,但它们的情感语义处理存在显著差异,这是由于情感意义在词汇访问过程中激活方式的不同(Wu & Zhang, 2020)。例如,Kazanas和Altarriba(2015, 2016)发现,情感标签词汇比情感带入词汇表现出更大的情感语义启动效应。这表明,情感标签词汇在激活情感语义方面具有更大的优势,更有效地引发了参与者的感情体验。此外,在Simon任务(Altarriba & Basnight-Brown, 2011)和Flanker任务(Zhang等,2019)中,发现情感标签词汇作为干扰项时,对目标识别产生了更大的干扰,并且比情感带入词汇更难抑制。这表明,情感标签词汇中的情感信息更加显著,并更有可能自动吸引注意力,导致注意力偏差。此外,使用ERP技术,Zhang等(2017)发现,情感标签词汇引发了更大的N170振幅,表明在早期阶段分配了更多的注意力,从而促进了情感信息的识别。综合这些发现,表明情感标签词汇在语义上与情感信息更为紧密关联,并在个体中更有效地激活情感反应,从而在情感语义激活方面具有优势。

根据情感语义表示的具身理论(Vigliocco等,2009),情感信息在情感标签词汇中的更显著作用可能归因于词汇的情感意义与其词汇概念之间的直接联系(Tang等,2023)。情感标签词汇的获取是通过社会化和情感互动形成的(Tang等,2023)。这些词汇与个体的亲身体验(Basnight-Brown & Altarriba, 2018)更为紧密相关。当情感标签词汇的词汇概念被激活时,情感意义也被同时激活。相比之下,情感带入词汇的获取更侧重于词汇概念的意义,而不是情感意义。情感带入词汇代表一种“中介”的情感概念(Tang等,2023),其中情感意义是通过概念意义与相关经验之间的联系激活的。因此,这些词汇的情感意义可能在词汇访问过程中不会立即被激活(Knickerbocker等,2015)。因此,与情感带入词汇相比,情感标签词汇更有可能从词汇概念中提取情感信息,更有效地吸引和维持注意力(Sutton & Altarriba, 2011),并在情感语义激活方面表现出优势。因此,为了研究自然文本中情感语义的在线处理,澄清情感语义在文本阅读中的差异是至关重要的(Wu & Zhang, 2020)。

因此,一些研究将不同类型的词汇嵌入句子中,通过比较情感标签词汇(Knickerbocker等,2015)或情感带入词汇(Knickerbocker等,2019)与中性词汇的注视行为来分析自然文本阅读中的情感语义处理。这些研究发现,情感标签词汇的情感语义激活发生得更早,而情感带入词汇则发生得更晚。这一模式在双语参与者中也被观察到(Tang & Ding, 2024)。然而,这些研究并未直接比较情感标签词汇和情感带入词汇在文本中的处理。因此,仍不确定这些情感词汇类型在自然文本中的语义差异是否存在,以及情感标签词汇是否在自然文本阅读中表现出情感语义激活的优势。因此,本研究旨在利用眼动追踪技术探索句子中情感标签词汇与情感带入词汇的语义差异,并识别自然文本中情感语义在线处理的行为模式。

此外,自然文本中的情感语义处理还受到语言经验的影响(Sheikh & Titone, 2013),如词汇频率、习得年龄和语义多样性(Diveica等,2024)。这些语言因素在读者的内部词汇中起到桥梁作用,连接词汇形式表示和语义表示,促进词汇识别和语义检索(Chapman & Martin, 2022)。其中,词汇频率,定义为词汇在给定语料库中的出现频率,是自然阅读中词汇访问的关键指标(Scott等,2009;Sereno & Rayner, 2003)。它可以指示词汇访问阶段是否存在处理差异(Scott等,2009, 2012)。以前操控词汇频率和情感语义的研究发现,词汇频率和情感语义的效果发生在同一阶段(Scott等,2012;Yan & Sommer, 2015)。这表明读者可以在词汇访问阶段提取情感信息。此外,当词汇频率作为语言经验时,它会限制情感语义的访问,使得情感信息只能在特定条件下从词汇中提取(Kuperman等,2014)。

然而,目前尚缺乏直接研究,以确定在自然文本阅读中情感词汇之间的语义差异是否在词汇访问阶段发生。此外,仍不清楚文本中情感语义差异的处理是否同样受到词汇频率的限制。因此,本研究结合词汇频率与情感语义差异,以明确这些差异在自然文本阅读中的发生阶段(Scott等,2012)。它还旨在阐明词汇频率作为语言经验如何共同促进情感语义的访问(Sheikh & Titone, 2013)。这项研究将通过利用词汇频率提取关键词并进行情感文本的语义聚类,从而帮助NLP模型更好地与真实的人类认知行为对齐。

总之,为了弥补自然文本阅读中情感语义处理的现有不足,本研究旨在回答两个主要问题。首先,情感词汇之间的语义差异是否在自然文本阅读中被处理(即句子)?为了探索这一点,研究将使用眼动追踪技术,将两种类型的情感词汇(情感标签词汇与情感带入词汇)嵌入计算机呈现的句子中,并分析其产生的行为模式。其次,情感词汇之间的语义差异是否在词汇访问阶段被处理,并且这一处理是否受到语言经验的限制?为了研究这一点,研究将操控两种类型情感词汇的词汇频率,以考察其与语义处理的交互作用,并确定这些差异是否在词汇访问阶段发生。此外,研究还将阐明词汇频率作为语言经验如何影响情感语义差异的处理。鉴于证据表明词汇情感值可以影响情感语义的处理(Kaye等,2023;Schindler等,2023),研究将在积极情感值(实验一)和消极情感值(实验二)的条件下进行,并且研究将在中国语境下进行,这与之前的研究操控(例如Knickerbocker等,2015;Knickerbocker等,2019;Tang & Ding, 2024)相一致。

本研究的主要研究问题(RQ)如下:
- **RQ1**:在自然文本阅读中,情感词汇之间的在线处理是否存在差异?
- **RQ2**:词汇频率是否影响情感词汇之间的语义处理差异?

实验一旨在探讨在积极情感值下,情感标签词汇与情感带入词汇之间的语义差异是否在自然文本阅读中被处理(RQ1),同时操控两种类型情感词汇的词汇频率,以考察其是否影响这些词汇之间的语义处理差异(RQ2)。实验一采用了与之前研究(如Scott等,2012)一致的2×2完全因子设计,其中情感词汇类型(积极标签词汇与积极带入词汇)和词汇频率(高频与低频)在同一句子框架中被操控。参与者在计算机上阅读句子,完成阅读任务后进行随机理解测试。

根据之前的研究,预计在自然文本阅读中,积极标签词汇与积极带入词汇之间的语义差异仍然显著,积极标签词汇会保持其情感语义优势。具体来说,积极标签词汇的情感信息在词汇访问过程中与词汇意义同时被激活(Altarriba & Basnight-Brown, 2011;Sutton & Altarriba, 2011),这会吸引读者的注意力(Zhang等,2017),引发注意力偏差(Altarriba & Basnight-Brown, 2011),并使读者更难脱离。这预计会导致积极标签词汇的注视时间更长。关于词汇频率影响的预测基于语义网络模型(Collins & Loftus, 1975)。根据该模型,词汇的语义表示存储在一个网络中,并且是分层组织的,原型概念位于更高层次。词汇的语义距离越接近原型概念,其相关语义记忆的激活就越快(Kumar等,2022)。这种激活还受到连接强度的影响,而连接强度由词汇熟悉度决定(Collins & Loftus, 1975)。词汇频率反映了读者对词汇的熟悉度,高频词汇表示更高的熟悉度(Sereno & Rayner, 2003)。因此,词汇的频繁出现可以增强其与原型概念的连接,使激活更自动(Collins & Loftus, 1975)。积极词汇在网络中存储密度更高,语义距离更短(Unkelbach等,2008),其频繁出现进一步增强了其语义激活的自动性。积极标签词汇本质上比积极带入词汇更接近情感原型概念(Ferré等,2024)。积极标签词汇的频繁出现提供了更大的激活情感语义的优势。这有助于更容易地从积极标签词汇中提取情感信息,从而吸引和维持读者的注意力。因此,预计在高频条件下,积极标签词汇的情感语义优势会更加明显,导致更大的注意力和更长的注视时间。

实验一中,40名参与者(31名女性),年龄在18至25岁之间(M年龄=20.77岁,SD年龄=2.01),被招募参与研究。所有参与者都是母语为汉语的右利手者,具有正常或矫正后正常的视力,并且没有阅读障碍或神经损伤的诊断。由于参与者的情感状态可能影响情感文本的处理(Knickerbocker等,2015),他们在实验前完成了贝克抑郁量表(BDI-II;Zung, 1986)和状态-特质焦虑量表(STAI;Spielberger等,1971)。这些分数被作为协变量纳入数据分析中。我们使用Mixedpower包(Kumle等,2021)运行了1000次模拟,以评估当前样本大小是否具有足够的统计功效,能够检测到与Scott等(2012)描述相似的注视时间调节效应。模拟结果表明,当前样本大小在α=0.05时的统计功效超过0.90。

实验材料和设备基于已有的情感词汇类型选择方法(例如Jia等,2023;Liu等,2023;Tang等,2024;Zhang等,2019),30名未参与阅读实验的参与者根据情感标签词汇和情感带入词汇的定义对语料库中的情感词汇进行分类。基于超过80%的一致性标准(Liu等,2023;Wang等,2019),共识别出348个情感词汇,包括61个积极标签词汇(M一致性=96.23%,SD一致性=6%)、96个积极带入词汇(M一致性=95.49%,SD一致性=6%)、80个消极标签词汇(M一致性=94.54%,SD一致性=7%)和111个消极带入词汇(M一致性=92.82%,SD一致性=6%)。此外,Wang等(2019)和Liu等(2023)的实验材料也被纳入我们的语料库。去除重复后,语料库包含366个词汇,其中61个积极标签词汇,包括99个积极带入词汇,90个消极标签词汇,以及116个消极带入词汇。

控制了笔画数(F(3, 84)=0.38,p=0.77)、词族大小(F(3, 84)=1.29,p=0.28)、抽象性(F(3, 84)=1.82,p=0.15)、愉悦度(F(3, 84)=1.84,p=0.15)和唤醒度(F(3, 84)=1.10,p=0.35)等变量后,从语料库中选择了88个双字词,每种条件各22个词。目标词的这些变量均值如表1所示。在积极标签词汇和积极带入词汇之间未发现显著的词汇频率差异(t(86)=0.38,p=0.71)。同样,在高频和低频条件下,积极标签词汇与积极带入词汇之间也未发现显著的频率差异(高频条件,t(42)=0.02,p=0.99;低频条件,t(42)=0.19,p=0.85)。在高频和低频条件之间发现了显著的词汇频率差异(t(86)=2.69,p=0.009)。

实验句子是通过将目标词汇嵌入单行文本中创建的。积极高频和低频标签词汇,以及积极高频和低频带入词汇被配对,共创建了22个词对。每对目标词汇嵌入四个句子框架中,基于之前的研究方法(Knickerbocker等,2015, 2019;Tang & Ding, 2024)。目标词汇出现在句子的中间位置(不在句子的前三个或后三个词汇中),如表2所示。

实验句子的长度在20到34个字符之间,平均长度为27个字符(SD长度=3.49)。句子上下文被设计为非预测性的,以最小化对目标词汇的自上而下处理。为了验证这一点,15名参与者完成了闭合测试,预测在呈现到目标词汇前的句子中的下一个词。结果显示,目标词汇的可预测性非常低(M可预测性=0.01%,SD可预测性=2%),且在所有条件下没有显著差异(F=0.15,p=0.70)。此外,20名未参与闭合测试或阅读实验的参与者对实验句子的可理解性进行了评分,评分范围为1(不可理解)到5(非常可理解)。所有实验句子都被评为高度可理解(M可理解性=4.13,SD可理解性=0.22),且在所有条件下没有显著差异(F=2.16,p=0.15)。

实验句子使用拉丁方设计平衡了所有条件,形成四个列表。每个列表包含88个实验句子、44个中性填充句子和10个练习句子,共计142个句子。中性填充句子不与实验句子属于同一句子框架,而是完全不同的句子。每个参与者仅阅读一个列表,其中每个目标词汇和句子只出现一次。句子在实验过程中以完全随机的顺序呈现。

使用SR Eyelink 1000 Plus眼动追踪器,在双眼观看时以1000 Hz的采样率记录右眼的眼动。句子以Song 32点字体(43×43像素)呈现于24英寸的DELL显示器(1920×1080像素;120 Hz刷新率)。参与者坐在距离屏幕70厘米的位置,头部通过下巴支撑器稳定,以最小化移动。每个字符的视觉角度约为0.97°,这是正常的阅读大小。

实验二进一步探讨了在消极情感值下,情感标签词汇和情感带入词汇之间的语义差异在自然阅读中的在线处理,以及词汇频率如何影响这些差异。实验设计遵循实验一的相同程序。

在自然文本阅读中处理消极标签词汇和消极带入词汇的语义差异时,我们预计会得到与实验一相似的结果,即消极标签词汇具有情感语义优势。我们预计消极标签词汇会更快地访问情感语义,吸引读者的注意力,并导致更长的注视时间。然而,我们预计在消极情感值下,词汇频率对这些差异的调节作用会与实验一在积极情感值下的调节作用不同。消极词汇在语义记忆中的存储密度较低,语义距离较大(Unkelbach等,2008),这使得它们在语义网络中的激活优势有限。虽然频繁出现的消极词汇可以增强词汇与语义之间的联系,但这种效果受到词汇与原型概念之间语义距离的限制。高频词汇主要在语义距离较近时增强语义激活(Collins & Loftus, 1975)。相反,消极刺激在感知注意力方面表现出明显的优势(Mather & Sutherland, 2011;Sakaki等,2011)。它们的生存价值较高,往往更吸引注意力,更具吸引力。然而,消极刺激的优势取决于其出现频率。当消极词汇频繁出现时,其显著性会降低,从而减少其在注意力和参与度上的优势。相反,当这些词汇出现频率较低时,它们的显著性更高,从而更吸引注意力和参与度(Scott等,2012)。因此,消极词汇的显著性对注意力的影响在低频条件下更为显著。对于消极标签词汇,其情感语义优势来源于词汇访问过程中情感信息的快速提取。当这些词汇频繁出现时,其在词汇访问过程中的情感显著性可能会减弱,导致情感优势的丧失。相反,当这些词汇出现频率较低时,其情感信息的显著性仍然存在,从而在词汇访问过程中更吸引读者的注意力。因此,我们假设在处理消极标签词汇和消极带入词汇的语义差异时,低频条件会表现出更显著的效果。具体来说,我们预计低频消极标签词汇会表现出更显著的语义优势,吸引读者的注意力,导致更长的注视时间。

在实验二中,我们采用了与实验一相同的句子框架,创建了22个词对,配对了消极高频和低频标签词汇,以及消极高频和低频带入词汇。每对目标词汇嵌入四个句子框架中,形成了总共88个独特的句子框架。句子长度从17到34个字符不等,平均长度为27个字符(SD长度=3.76)。实验句子的示例如表6所示。在所有条件下,目标词汇的可预测性(F=0.53,p=0.47)和句子的可理解性(F=0.54,p=0.46)均无显著差异。

实验句子被组织成四个列表,与实验一相似。每个列表包含88个实验句子、44个中性填充句子和10个练习句子,共计142个句子。实验二中的中性填充句子不仅与实验句子不同,还与实验一中的中性填充句子不同。

实验装置和句子呈现与实验一相同。

实验二的程序与实验一相同。参与者平均准确率约为90%(SD准确率=8%)。

实验二的结果显示,眼动标准测量与实验一一致。排除注视和试验的标准与实验一相同,包括:(1)注视次数少于三次的试验(0.1%);(2)因咳嗽、头部移动或眨眼而在AOI中丢失追踪的试验(0.1%);(3)在AOI中偏离均值2.5个标准差的注视(2%)。数据分析遵循与实验一相同的程序。所有条件下的目标词汇平均注视时间如表7所示,统计效应如表8所示。

尽管参与者的抑郁和焦虑影响了消极词汇在早期阶段(FFD和SFD,见表8)的处理,但情感词汇类型的主要效应仍然显著。与实验一相似,消极标签词汇的注视时间更长,表明它们在早期和晚期阶段均吸引了更多读者的注意力。这些差异在早期阶段(FFD,SFD和GD)以及晚期阶段(TT)均显著,表明在消极情感值下,词汇频率对情感词汇类型的语义处理差异产生了影响。

实验一和实验二的结果表明,词汇频率与情感词汇类型之间的交互作用在处理早期阶段(FFD,SFD和GD)出现。这表明情感语义处理差异在词汇访问的早期阶段显现,并受到词汇频率的影响,导致情感标签词汇在特定条件下表现出语义优势。具体来说,在积极情感值下,词汇频率仅在词汇访问的早期阶段影响情感语义处理(FFD,SFD和GD)。在这一阶段,积极标签词汇在高频条件下表现出情感语义优势,表明高频出现增强了情感意义与词汇概念之间的联系。因此,在词汇访问的早期阶段,积极标签词汇的情感信息可以更容易和更快地被提取,从而导致更高的参与度和更长的注视时间。然而,一旦积极标签词汇被完全访问并进入晚期整合阶段,词汇频率就不再影响它们。相比之下,消极标签词汇的语义优势在高频条件下未被观察到,并且在词汇访问的早期阶段到晚期深度处理阶段(TT)均受到词汇频率的影响。在消极情感值下,情感标签词汇的语义优势仅在低频条件下显现。当消极标签词汇出现频率较低时,其情感显著性更为明显,从而导致更高的参与度和更长的注视时间。

词汇频率通过降低语义激活的阈值,促进词汇意义的快速访问,特别是在词汇识别的早期阶段(Adelman等,2006;Chapman & Martin, 2022)。高频词汇的处理速度更快,这体现在较短的注视持续时间(例如FFD,SFD,GD和TT)上,因为它们的激活阈值较低(Scott等,2009)。本研究还发现,词汇频率调节了情感语义处理,且在不同情感值下表现出不同的影响。对于积极词汇,频繁接触增强了积极标签词汇的情感语义激活优势,但仅限于词汇访问的早期阶段(Unkelbach等,2008)。相反,消极词汇由于在记忆中分布较广,其情感连接受到词汇频率的影响较小。它们的情感影响在低频条件下更为显著,因为它们需要更深层次的处理,并且在出现频率较低时更具吸引力(Mather & Sutherland, 2011)。这些发现表明,积极词汇受益于语义处理优势,而消极词汇则更多地从注意力处理中获益,突显了基于情感值的不同认知优势(Mather & Sutherland, 2011;Sakaki等,2011)。

基于此,情感文本分析可以利用词汇频率信息优化情感识别算法。例如,在调整情感权重时,结合积极和消极词汇的不同特征,可以实现对情感文本分析的更动态和细致的处理。通过根据这些频率相关特征调整情感权重,情感模型可以更精确地识别积极和消极情感内容。此外,这种方法还可以用于分析文本中混合或变化的情感状态。例如,低频消极词汇的出现可能表明情感强度的增强,促使模型应用更深入的分析技术来更好地理解情感背景。相反,高频积极词汇可能引发更快的情感识别,使情感分析更加高效。因此,调整情感分析模型以考虑词汇频率,可以提供更适应、更具上下文感知的分析方法,确保积极和消极情感值中的情感细微差别被准确捕捉。通过优化情感算法,NLP系统可以更好地反映情感表达的复杂性,从而提供更全面和有洞察力的用户生成内容分析。

总之,本研究首次使用眼动测量探索了自然文本阅读中情感语义差异的行为模式。研究结果揭示了情感标签词汇相比情感带入词汇在情感语义处理中表现出更显著的优势。情感标签词汇的情感语义在处理各个阶段均比情感带入词汇激活得更快,从而更有效地提取情感信息。这导致了读者更高的参与度和更长的注视时间,突显了情感标签词汇的情感语义优势。此外,情感标签词汇的语义优势在词汇访问的早期阶段显现,并受到词汇频率的影响。具体来说,词汇频率作为一种语言经验,限制了情感信息的提取和感知,使得情感标签词汇的情感语义激活优势仅在特定条件下显现。高频词汇促进了积极标签词汇的情感信息提取,但对消极标签词汇的感知注意力产生了抑制作用。相反,低频词汇增强了消极标签词汇的情感显著性,但削弱了积极标签词汇的情感激活。这表明,文本中情感的识别受到语义表示和语言经验的差异影响。未来关于情感文本处理的研究应考虑情感词汇的类型及相关因素。

本研究的主要研究问题(RQ)如下:
- **RQ1**:在自然文本阅读中,情感词汇之间的在线处理是否存在差异?
- **RQ2**:词汇频率是否影响情感词汇之间的语义处理差异?

实验一旨在探讨在积极情感值下,情感标签词汇与情感带入词汇之间的语义差异是否在自然文本阅读中被处理(RQ1),同时操控两种类型情感词汇的词汇频率,以考察其是否影响这些词汇之间的语义处理差异(RQ2)。实验二进一步探讨了在消极情感值下,情感标签词汇与情感带入词汇之间的语义差异在自然文本阅读中的在线处理(RQ1),并研究了词汇频率对这些处理的影响(RQ2),以实现对文本阅读的全面理解。

实验一和实验二的结果揭示了情感词汇之间的语义差异,并发现了词汇频率的影响及其交互作用在自然文本阅读中的显著性。这表明,在在线阅读中,情感语义差异是显著的,情感标签词汇在情感语义激活方面具有优势。情感标签词汇的情感信息被更快地提取和访问,从而吸引了更多的读者注意力。这些差异在词汇访问的早期阶段显现,并受到词汇频率的影响。然而,在消极情感值下,词汇频率对情感词汇类型语义处理的影响与积极情感值下的影响有所不同。情感标签词汇和情感带入词汇之间的语义差异仅在低频条件下显现。消极词汇在语义记忆中的存储密度较低,语义距离较大(Unkelbach等,2008),因此它们在语义处理上的优势不如积极词汇(Sakaki等,2011)。相反,消极词汇在感知注意力方面表现出显著优势(Mather & Sutherland, 2011),导致更大的注意力捕捉。然而,词汇频率作为语言经验的一部分,限制了消极词汇的这一优势(Scott等,2012)。频繁出现的消极词汇表现出较低的情感显著性,从而导致较少的参与度。相比之下,较少出现的消极词汇表现出较高的情感显著性,从而导致更多的参与度(Scott等,2012)。因此,高频消极标签词汇在词汇访问过程中情感信息的激活效果减弱,而低频消极标签词汇表现出增强的激活效果,从而导致更长的注视时间。此外,消极词汇在语义网络中的表示密度较低,需要更详细的处理才能准确访问其意义(Unkelbach等,2008)。这不仅延长了消极词汇的词汇访问过程,还使其更容易受到其他词汇属性的影响(Kuperman等,2014)。因此,词汇频率对消极词汇的语义处理产生了影响,贯穿整个词汇处理阶段,包括早期词汇访问(FFD,SFD
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号