编辑推荐:
为解决语言与其他情绪测量方法关系不明的问题,美国得克萨斯大学奥斯汀分校等机构的研究人员开展语言与多种情绪测量方法关联的研究。结果发现语言测量(尤其是 valence 测量)与其他方法相关。该研究为情绪研究提供新思路,值得一读。
在心理学的研究领域中,情绪测量一直是一个热门话题。心理学家们为了探究人类的情绪,使出了浑身解数,采用了各种各样的方法。其中,自我报告法就像是让人们自己说说心里的感受,用一些量表来衡量情绪;行为编码法则聚焦于观察人们的行为,比如从面部表情、说话声音里寻找情绪的蛛丝马迹;而随着时代发展,语言分析也逐渐崭露头角,通过研究人们说的话、写的文字来挖掘情绪信息。
近年来,语言分析在情绪研究中的应用越来越广泛。这是因为技术进步了,互联网上的语言数据铺天盖地,就像一个巨大的宝藏,为研究提供了丰富的素材。而且语言分析还特别 “能干”,在很多领域都发挥了大作用。比如研究集体创伤的时候,通过分析人们在社交媒体、博客上的发言,能了解大家面对创伤时的情绪变化;在消费者行为研究中,分析产品评论里的语言,能知道消费者对产品的喜欢或不满;还有研究日常生活中的情绪,分析日常对话、日记里的语言,也能发现不少有趣的情绪线索。
不过呢,虽然语言分析看起来很厉害,但它和其他情绪测量方法之间到底有什么关系,却没被研究得很透彻。以前的研究大多只关注语言和自我报告之间的联系,对于语言和其他测量方法,比如观察者报告、面部表情线索、声音线索之间的关系,了解得少之又少。而且,研究人员用不同的词典(像 LIWC - 22、NRC、Lexical Suite、ANEW、VADER 这些)来分析语言中的情绪,这些词典的分析结果和其他测量方法的结果之间有什么关联,也不清楚。所以,为了填补这些知识空白,更好地理解语言和其他情绪测量方法之间的关系,来自美国得克萨斯大学奥斯汀分校等机构的研究人员进行了一项重要研究。
这项研究成果发表在了《Nature Human Behaviour》期刊上,论文题目是 “Language measures of emotion are associated with other measures of emotion across multiple datasets”。研究人员通过一系列的实验和分析,得出了不少重要结论。这些结论不仅让我们对语言和情绪测量的关系有了新的认识,还有助于在未来的研究中,为研究人员选择合适的情绪测量方法提供参考,意义重大。
在这项研究中,研究人员主要采用了以下几种关键技术方法:首先,他们收集了三个大型多模态数据集。Dataset 1 是来自美国南部 602 名参与者写的关于社会拒绝经历的书面叙述;Dataset 2 取自斯坦福情感叙事数据集(SEND),是美国西海岸 49 名参与者讲述的情感故事的视频转录文本;Dataset 3(包括 3a 和 3b)来自 CANDOR 语料库,是 1456 名美国参与者进行的自然对话记录。其次,他们从 5 个不同的词典中选取了 15 种语言测量指标,用来分析语言中的情绪,这些指标有的衡量情绪的正负(valence),有的衡量离散情绪(比如 anger、fear、sadness)。然后,在三个数据集中,研究人员分别用自我报告、观察者报告、面部表情分析软件和语音分析软件等方式,收集了不同类型的情绪测量数据。最后,他们对数据进行清洗和转换,再用 Spearman 相关性分析来探究语言测量指标和其他情绪测量方法之间的关系。
下面我们来看看具体的研究结果:
- 语言测量与自我报告的关系:在 Dataset 1 和 Dataset 2 中,语言测量指标和自我报告的情绪有显著关联。比如在 Dataset 1 里,6 个衡量情绪正负的语言指标中有 5 个与更积极的自我报告情绪显著相关;Dataset 2 里,这 6 个指标全部与更积极的自我报告情绪显著相关。在衡量离散负面情绪的 9 个语言指标中,Dataset 1 里有 6 个、Dataset 2 里有 8 个与更负面的自我报告情绪显著相关。但是在 Dataset 3a 和 3b 中,语言测量指标和自我报告情绪之间却没有显著的关联。
- 语言测量与观察者报告的关系:在 Dataset 2 中,语言测量指标和观察者报告的情绪显著相关。6 个衡量情绪正负的语言指标都与更积极的观察者报告情绪显著相关,9 个衡量离散负面情绪的语言指标中有 8 个与更负面的观察者报告情绪显著相关。
- 语言测量与面部表情线索的关系:语言测量指标和面部表情线索的关系有点复杂。在 Dataset 2 中,6 个衡量情绪正负的语言指标里有 3 个与更可能出现的快乐面部表情显著相关,2 个与更低可能出现的负面面部表情(愤怒、恐惧、悲伤的平均)显著相关。在 Dataset 3a 和 3b 中,5 个衡量情绪正负的语言指标里有 4 个与更可能出现的快乐面部表情显著相关,3 个与更低可能出现的负面面部表情显著相关。然而,衡量离散情绪的语言指标和面部表情线索之间大多没有显著关联。
- 语言测量与声音线索的关系:语言测量指标和声音线索之间的关联不太稳定。在 Dataset 2 中,6 个衡量情绪正负的语言指标里只有 1 个与更高的声频显著相关,而且没有指标与声音强度显著相关。在 Dataset 3a 和 3b 中,虽然有 2 个衡量情绪正负的语言指标与更高的声频显著相关,还有 4 个衡量离散负面情绪的语言指标与更高的声频、2 个与更高的声音强度相关,但整体结果不太一致。
- 不同词典测量结果的差异:研究发现,不同词典的测量结果之间差异不大。对衡量情绪正负的语言指标进行分析,10 次配对 t 检验中只有 2 次发现不同词典测量结果的关联模式有显著差异。衡量离散情绪的 LIWC 和 NRC 指标,在 9 次配对 t 检验中也只有 1 次发现关联模式有显著差异。
研究人员在讨论部分指出,这次的研究结果表明,语言测量指标和其他常用的情绪测量方法之间的关联,会因不同的测量方法和语言测量指标而有所不同。语言测量指标和自我报告、观察者报告之间的关联比较稳定,这和以前的一些研究结果相符,而且还拓展了研究范围,用了更多的词典进行分析。但是语言测量指标和面部表情、声音线索之间的关联就不太稳定,这可能和非言语线索与离散情绪的关系本来就不明确有关,也可能是因为人们在表达情绪时,受到一些规则的影响,比如可能不太愿意通过面部表情展示负面情绪,但语言中却能更多地体现出来。
另外,语言测量指标和自我报告情绪在不同任务中的关联也不一样。在 Dataset 2 的 2 分钟独白任务中两者有关联,在 Dataset 3a 和 3b 的 30 分钟对话任务中却没有,这可能是因为长时间的自我报告不太准确,也可能是因为自然场景下的语言和自我报告的关联本来就弱。而且,研究还发现社会情境可能会影响语言、面部表情和声音测量之间的一致性,在人际互动中,这些测量之间的关联可能更强,但也有可能是因为对话任务中的文本和单词更多,或者是测量技术的差异导致的,还需要进一步研究。
这项研究虽然有很多优点,比如考虑了多种词典、情绪测量方法和研究情境,但也存在一些局限性。研究样本都是说美式英语的,不同语言和文化背景下,语言和其他情绪测量方法的关系可能不一样,还需要用非英语样本进行研究。而且研究只是探究了不同测量方法之间的关系,没办法确定这些方法是不是真的能准确反映情绪内容。另外,研究中用的自动机器学习方法测量面部和声音线索,可能不太准确,不同数据集用的测量软件也不一样,会增加测量误差。
总的来说,这项研究意义非凡。它让我们知道,语言测量指标,尤其是衡量情绪正负的指标,和其他常用的情绪测量方法之间有稳定的关联,而且不同词典的测量结果差异不大。这意味着当研究人员没办法用自我报告或行为编码法时,语言测量可能是个不错的选择。同时,研究结果也让我们对自我报告在长时间测量情绪时的准确性产生了思考,或许在这种情况下,语言测量更有优势。此外,研究还为情绪测量在不同社会情境下的一致性研究提供了新的思路,虽然还存在一些问题,但也为后续研究指明了方向,让我们对情绪测量的理解又向前迈进了一大步。