
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于三轴句法融合的稀疏三元组重叠关系抽取增强方法
【字体: 大 中 小 】 时间:2025年09月05日 来源:Knowledge-Based Systems 7.6
编辑推荐:
本文提出ALSAMIR(Aspect-Level Sentiment-Aware Mining of Inter-Review relations)模型,创新性地通过细粒度情感分析构建评论关系图(GCN),结合图采样技术和注意力机制,有效解决虚假评论检测中的语义关系建模与类别不平衡问题。该模型在Yelp等数据集上AUC提升最高达7.11%,为电商平台虚假评论治理提供新思路。
Highlight
本研究突破性地开发了ALSAMIR系统,通过四大创新模块实现虚假评论精准捕获:1)基于细粒度情感特征的图谱构建技术,捕捉评论间微妙的情感关联模式;2)首创的图神经网络(Graph Neural Network)过采样方案,有效缓解数据倾斜问题;3)融合图卷积网络(GCN)的语义聚合引擎;4)动态注意力机制,智能识别高阶非线性特征。实验证明其在YelpZip数据集上AUC指标显著提升7.11%。
Introduction
数字时代背景下,亚马逊、天猫等平台的在线评论深刻影响消费者决策。传统机器学习方法(如SVM、决策树)已难以应对日益复杂的虚假评论模式。例如,在Yelp Chi数据集中,两条语义相似的酒店评论("Sutton Place酒店服务卓越" vs "地理位置优越的小型酒店")仅通过文本特征难以辨别真伪。最新研究表明,基于图神经网络(GNN)的方法能有效捕捉评论者-产品-评论间的复杂网络关系,但现有研究多忽略评论间语义关联这一关键维度。
Methodology
如图2所示,ALSAMIR采用五阶段架构:1)通过方面情感分析构建异构图谱;2)应用基于图的过采样技术平衡数据分布;3)采用多层GCN学习评论嵌入表示;4)动态注意力机制计算特征权重;5)最终通过分类器实现预测。特别设计的方面情感图谱能识别异常行为模式,如多个评论对"配送"、"价格"等维度呈现不自然的情绪一致性。
Experiments and Evaluation
在Hotels、Restaurants等四个公开数据集上的测试显示,ALSAMIR各项指标全面领先:YelpZip数据集AUC提升7.11%,Recall提高3.01%。消融实验证实,方面情感图谱和过采样模块分别贡献了32.4%和18.7%的性能增益。
Conclusion
ALSAMIR通过创新性地挖掘评论间细粒度情感关联,结合图神经网络优势,为虚假评论检测提供了新范式。未来工作将探索自动化方面提取技术,以进一步提升模型适用性。
生物通微信公众号
知名企业招聘