基于多粒度图卷积网络的方面情感分析研究:融合依存与成分树结构特征

【字体: 时间:2025年07月17日 来源:Neural Networks 6.0

编辑推荐:

  针对现有方面情感分析(ABSA)方法忽略成分树局部情感特征和未充分融合依存/成分树语法信息的问题,研究人员提出多粒度图卷积网络(MGCN)。通过构建语义关联矩阵、分层规则的多粒度掩码矩阵(CM/CDM/FM),实现从局部到全局的语法特征提取,在SemEval 2014和Twitter数据集上验证了模型有效性,为复杂语义场景下的情感分析提供了新思路。

  

在数字时代爆炸式增长的社交媒体内容中,用户对产品服务的评价往往包含针对特定方面的复杂情感表达。例如餐厅评论"食物很棒但服务糟糕"中,"食物"和"服务"两个方面的情感极性截然不同。这种方面级情感分析(Aspect-based sentiment analysis, ABSA)任务的核心挑战在于:如何准确捕捉句子中抽象语义关联,以及如何利用句法结构信息定位方面词与观点词的关系。现有方法虽通过注意力机制和图卷积网络(Graph Convolutional Network, GCN)取得进展,但仍存在两大缺陷——忽视成分树(Constituency Tree)的层级局部特征,以及未能有机融合依存树(Dependency Tree)与成分树的语法信息。

针对这些瓶颈,研究人员创新性地提出了多粒度图卷积网络(Multi-granularity Graph Convolutional Network, MGCN)。该模型通过三大核心模块实现突破:在注意力层构建语义关联矩阵捕捉全局语义;在掩码矩阵层设计基于分层规则的多粒度成分树掩码矩阵(CM)提取局部特征,并融合依存树信息生成多粒度融合掩码矩阵(FM);最后通过GCN强化节点表征。实验证明该方法在SemEval 2014和Twitter数据集上性能优越。

关键技术方法包括:1) 基于Bi-LSTM/BERT的上下文编码;2) 自注意力与方面感知注意力结合的语义关联建模;3) 分层规则构建的CM矩阵(覆盖短语级到句子级);4) 距离规则生成的DM矩阵与条件依赖矩阵融合;5) 语法-语义联合增强的GCN卷积操作。

主要研究结果

  1. 多粒度特征提取机制

    通过分析成分树层级结构(如图2所示),将句子"食物很棒但服务糟糕"分解为三层粒度:短语级("食物"/"很棒")、从句级("食物很棒")和句子级。实验证明这种从局部到全局的特征提取策略能显著提升模型对复杂句法的解析能力。

  2. 语法结构融合创新

    提出将依存树的DM矩阵与成分树的CM矩阵融合为FM矩阵,并引入语义关联矩阵增强。在Twitter数据集上的消融实验显示,融合模型比单一语法结构的基线模型准确率提升3.2%,验证了双树结构互补的优势。

  3. 跨数据集性能验证

    在SemEval 2014的Restaurant和Laptop子集上,MGCN的F1值分别达到82.1%和75.8%,较传统GCN方法平均提升2.4%。特别在含转折连词的多方面句子中,模型通过捕捉"but"等连接词的极性反转特征,错误率降低19.7%。

结论与展望

该研究通过多粒度语法特征融合和语义-语法协同增强机制,为ABSA任务提供了新范式。创新性设计的CM/FM矩阵不仅解决了成分树局部特征利用不足的问题,还开创了依存/成分树结构特征融合的先河。未来可探索的方向包括:将多粒度思想扩展到其他语法解析框架,以及研究跨语言场景下的语法特征迁移。论文成果已发表于《Neural Networks》,相关代码与数据集已在GitHub开源。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号