
-
生物通官微
陪你抓住生命科技
跳动的脉搏
ATESA-B?RT:基于异构集成学习的细粒度情感分析模型及其在在线评论中的应用
【字体: 大 中 小 】 时间:2025年07月03日 来源:Knowledge-Based Systems 7.2
编辑推荐:
【编辑推荐】针对在线评论中多维度情感极性识别难题,研究团队提出异构集成学习模型ATESA-B?RT,通过分解ATE(Aspect Term Extraction)和ATSA(Aspect Term Sentiment Analysis)两个子任务,整合BERT/BART预训练模型与BiLSTM/CNN架构,在公开数据集上实现超越现有方案的性能突破,为电商舆情分析提供新工具。
随着电子商务的蓬勃发展,海量在线评论成为消费者决策的重要参考。传统情感分析(Sentiment Analysis)虽能判断整体评论倾向,却难以捕捉"手机拍照清晰但续航差"这类多维度评价的复杂情感。这种细粒度的方面级情感分析(Aspect-Based Sentiment Analysis, ABSA)面临两大挑战:同一文本中多个方面术语(Aspect Term)的精准提取,以及针对每个术语的独立情感极性判定。现有单一模型在处理此类复杂语义时,常因忽略上下文依赖或特征提取不充分导致性能受限。
为此,研究人员开发了ATESA-B?RT异构集成学习模型。该研究创新性地将ABSA任务解耦为方面术语抽取(ATE)和方面情感分析(ATSA)两个子任务,采用六种基于Transformer架构的预训练模型(包括BERT和BART)构建异构学习器。通过argmax多分类策略集成各模型的预测结果,并结合线性分类器、双向长短期记忆网络(BiLSTM)以及CNN-BiLSTM混合架构,全面捕捉文本的局部n-gram特征与长距离依赖关系。实验选用SemEval-2014和ACL-14两个公开的英文评论数据集验证性能。
关键技术方法包括:1)使用预训练的BERT(base-uncased)和BART(large-cnn)模型提取上下文特征;2)通过Fine-tuning适配特定任务;3)采用BiLSTM处理序列依赖,CNN提取局部特征;4)集成学习框架下的多数投票机制。
研究结果显示:
结论部分指出,ATESA-B?RT通过异构模型互补优势,有效解决了多方面情感交织的解析难题。其创新点在于:1)融合自编码器(BERT)与自回归模型(BART)的差异化表征;2)结合注意力机制与序列建模的混合架构设计。该成果发表于《Knowledge-Based Systems》,为电商平台实时舆情监控、产品改进优先级排序提供了自动化解决方案,未来可扩展至多语言场景下的细粒度情感计算。
生物通微信公众号
知名企业招聘