
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于层次注意力与图学习的MBTI人格类型预测模型及其跨社交媒体应用研究
【字体: 大 中 小 】 时间:2025年08月09日 来源:Expert Systems with Applications 7.5
编辑推荐:
本文创新性地提出G-HAN(基于图的层次注意力网络)模型,通过构建人格词汇图(Personality Vocabulary Graph)和双重注意力机制,首次实现跨社交媒体(Kaggle/Twitter/Reddit)的用户级MBTI(迈尔斯-布里格斯类型指标)人格预测。研究证实该模型在F1值上显著超越基线模型,为精准用户画像(User Profiling)提供了通用解决方案,对定向营销(Targeted Marketing)和推荐系统具有重要实践价值。
Highlight
相关研究
用户倾向于在Twitter或Reddit等社交媒体分享人格类型。Big Five(大五人格)作为流行的人格测试,通过二元量表划分五类特质(Celli等,2013)。现有研究主要聚焦特定平台,而本研究突破性地实现跨平台人格预测。
MBTI数据集
采用三大代表性数据集:
• Kaggle:来自PersonalityCafe论坛的8,675名用户数据,每人约50条贴文
• Twitter:通过API抓取的12,000名用户推文
• Reddit:精选10个子版块的讨论内容
人格类型的语言特征
应用LIWC(语言查询与词数统计)工具解析三大平台文本,发现:
• 内向型(I)更频繁使用第一人称单数代词
• 直觉型(N)倾向使用抽象概念词汇
• 情感型(F)常见积极情绪词
模型架构
提出G-HAN模型(图1),包含:
人格词汇图:构建I/E、N/S、T/F、J/P四组对立类型的词汇关联网络
层次注意力:
词级注意力:捕捉关键人格指示词
句级注意力:筛选用户帖文中的诊断性语句
结论
G-HAN在跨平台测试中F1值提升显著,证明其能有效捕捉用户语言特征与人格类型的深层关联。该模型为社交媒体人格分析提供了通用框架,未来可扩展至心理健康评估等领域。
生物通微信公众号
知名企业招聘