编辑推荐:
为解决 ABSA 中隐式方面表达、上下文依赖模糊及领域标注数据有限的问题,研究人员开展基于指令调优结合辅助句生成与知识增强图卷积网络的研究。提出 ASE-ITGF 框架,在多数据集达 SOTA,为 ABS 领域提供新方法。
在自然语言处理领域, aspect-based sentiment analysis(ABSA)作为提取文本中特定方面情感信息的关键任务,长期面临隐式方面表达难以识别、上下文依赖关系模糊以及领域特定标注数据有限等挑战。现有方法虽借助预训练语言模型(PLMs),但在融合领域知识、解决上下文歧义及细化情感特征方面存在明显不足。如何提升模型对隐式方面的语义推理能力,增强上下文情感关联的建模精度,成为当前研究的关键瓶颈。
为突破上述难题,河南大学的研究人员开展了针对隐式方面检测的创新性研究。他们提出了辅助句增强指令调优图卷积框架(ASE-ITGF),旨在通过多模块协同提升 ABSA 任务性能。研究结果表明,该框架在 Restaurant14、Laptop 等五个基准数据集上均取得了 state-of-the-art(SOTA)结果,显著优于现有基线模型,为隐式方面检测和情感分析提供了新的解决思路。相关成果发表在《Expert Systems with Applications》。
研究采用的核心技术方法包括:
- 辅助句生成机制:利用 Labeled Latent Dirichlet Allocation(L-LDA)提取方面种子词,基于语义距离生成辅助句,引导 RoBERTa 学习特定方面表示。
- 指令调优:设计任务导向的指令模板(如 “预期目标方面是”),优化 PLMs 的上下文表示,增强 aspect-specific 特征提取。
- 知识增强图卷积网络:将 SenticNet 情感知识融入句法依赖图,构建情感感知注意力空间,通过双层 GCN 强化句法 - 语义对齐。
- 双层情感表示模块:结合 aspect-masking 和位置感知关系,突出关键情感节点,提升特征表示的全面性。
4. 实验与结果
在五个基准数据集(Laptop、Twitter、Restaurant14、Restaurant15、Restaurant16)上的实验显示,ASE-ITGF 在准确率和 F1 分数上均显著优于传统模型。例如,在 Restaurant14 数据集上达到 91.23% 准确率和 86.48% F1 分数,在 Laptop 数据集实现 85.32% 准确率和 82.87% F1 分数。消融实验表明,各模块(如辅助句、指令调优、SenticNet 集成)均对性能提升有显著贡献,缺失任一模块均导致检测精度下降。
5. 讨论
研究深入分析了指令类型、GCN 层数、学习率等因素的影响。结果显示,任务特定指令(如 “IT2:In this sentence, the intended aspect is”)在结构化数据中表现更优,而灵活指令在非正式文本(如 Twitter)中适应性更强。SenticNet 的引入显著提升了情感依赖图的表达能力,尤其在处理隐含情感时效果显著。此外,模型在 few-shot 和 zero-shot 场景下表现出较强泛化能力,在未见领域(如社交媒体应用评价)中仍保持较高准确率。
6. 结论与未来工作
ASE-ITGF 通过辅助句生成、指令调优与知识增强图卷积的协同,有效解决了 ABSA 中隐式方面检测的核心挑战。其创新点在于将语义提示、任务导向指令与情感知识深度融合,为复杂语境下的情感分析提供了可解释的解决方案。未来研究计划拓展至多语言场景,探索自动化指令生成技术,并集成更多外部知识源(如领域情感词典),进一步提升模型在低资源和跨领域场景中的性能。该研究不仅深化了 ABSA 领域的技术突破,也为自然语言处理中隐含语义理解提供了新的方法论参考。