
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Emoji-Dis:首个基于13种离散情绪特征的大规模表情符号数据集研究
【字体: 大 中 小 】 时间:2025年07月30日 来源:Scientific Data 5.8
编辑推荐:
本研究针对数字通信中表情符号(emoji)情感表征缺乏系统数据的问题,开发了包含112个面部表情符号在13种离散情绪(含8种积极情绪)的标准化数据集Emoji-Dis。西班牙多机构联合团队通过763名受试者的主观评估,首次提供了愤怒、愉悦等情绪维度的量化指标,验证了表情符号与词汇情感特征的高度一致性。该数据集填补了积极情绪研究空白,为社交媒体分析、人机交互设计等领域提供了重要工具。
在数字通信爆炸式增长的时代,表情符号已成为全球通用的情感载体。然而科学界长期面临一个尴尬困境:这些每天被发送60亿次的图形符号,其情感属性却缺乏系统性量化数据。现有研究多聚焦于消极情绪,而实际上75%的emoji使用场景涉及积极情绪表达——这种研究失衡使得我们难以精准解析数字交互中的情感脉络,也制约了情感计算、心理健康监测等领域的发展。
针对这一空白,西班牙罗维拉-维尔吉利大学(Universitat Rovira i Virgili)联合穆尔西亚大学等机构的研究团队在《Scientific Data》发表了突破性研究。他们创新性地采用离散情绪理论框架,首次对112个面部表情符号进行13维情感测绘,其中包含 contentment(满足感)、awe(敬畏)等8种常被忽视的积极情绪,构建了目前最全面的表情符号情感数据库Emoji-Dis。
研究采用标准化心理测量学流程:从Unicode13.0筛选具情感潜力的面部emoji,通过TestMaker平台收集763名西班牙语使用者对5点Likert量表的评估。数据清洗剔除低相关性应答后,采用组内相关系数(ICC=0.97)验证了极高信度。为增强实用性,团队还将该数据集与前期开发的Emoji-SP(含效价、唤醒度等维度)进行关联整合。
技术方法亮点
研究通过多中心协作收集763人次的评估数据,采用TestMaker57构建13个平行问卷。关键创新包括:1) 引入"I don't know"选项过滤认知偏差;2) 基于Hinojosa情绪词库标准化定义13种情绪;3) 通过相关系数阈值(r<0.1)剔除异常应答;4) 与维度情绪数据进行跨模态验证。
情绪特征分布
数据揭示所有情绪维度均呈负偏态分布(均值<2.5),但各emoji存在全量程差异。如图1所示,happiness(4.69)与anger(4.73)均出现接近满分的极端案例,证实表情符号具有鲜明的情感特异性。

情绪相关性网络
图2显示消极情绪与效价(Valence)呈强负相关(r≈-0.8),与唤醒度(Arousal)正相关;积极情绪则呈现镜像模式。值得注意的是,contentment与serenity(宁静)存在独特关联(r=0.82),这为区分积极情绪亚型提供了实证依据。

跨模态验证
与Hinojosa词库的对比发现,emoji与词汇在anger-happiness维度的相关模式高度一致(r=0.91),但emoji对awe等复杂情绪的表征更突出。这证实图形符号具有超越文字的情感表达能力。
这项研究开创性地构建了首个涵盖多元积极情绪的表情符号数据库,其重要意义体现在三方面:首先,为情感计算提供了标准化工具,能提升社交媒体情绪分析的精度;其次,通过揭示emoji特有的"情感指纹",为人机交互中的情感化设计提供科学依据;最后,建立的跨模态验证方法,为未来多符号系统研究树立了新范式。团队特别指出,当前数据虽基于西班牙样本,但前期维度研究显示不同文化间具有较高一致性,这增强了数据的普适价值。
研究也存在需完善之处:性别比例失衡(女性66%)可能影响情绪评分模式;未来可扩展至非面部emoji及动态表情。这些发现为数字人类学、临床心理学等学科开辟了新研究方向——当人们用
生物通微信公众号
知名企业招聘