停止仇恨,传播希望:一种用于检测英语和德拉维达语中希望演讲的集成模型
《ACM Transactions on Asian and Low-Resource Language Information Processing》:Stop the Hate, Spread the Hope: An Ensemble Model for Hope Speech Detection in English and Dravidian Languages
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
本文针对低资源语言中希望演讲检测的研究不足问题,提出基于LSTM、mBERT和XLM-RoBERTa的集成模型。通过英语、卡纳达语、马拉雅拉姆语和泰米尔语四语料实验,证明集成模型在加权平均F1值上优于单一模型,其中英语达0.93,泰米尔语0.60。该模型为多语言希望演讲检测提供了有效解决方案。
摘要
社交媒体的兴起导致了大量用户生成的内容,其中情感范围从喜悦到愤怒不等。负面评论往往针对个人、社区或品牌,这促使人们努力检测有害言论,如仇恨言论、网络欺凌和辱骂行为。最近,一种被称为“希望言论”的新型言论引起了研究界的关注。希望言论包含积极的肯定语、安慰的话语、鼓励或激励,旨在帮助人们在生活中的困难时期。然而,针对希望言论的检测研究相对较少,尤其是在资源匮乏的语言中。因此,本文试图开发一种集成模型,用于检测某些资源匮乏语言中的希望言论。本文收集了四种不同语言(英语、卡纳达语、马拉雅拉姆语和泰米尔语)的数据,并尝试了多种基于深度学习的模型。所提出的集成模型结合了表现更好的模型的优势。实验结果表明,与单独的模型相比,该集成模型(LSTM、mBERT、XLM-RoBERTa)在所有四种语言的数据上都具有更优的性能(英语的加权平均F1分数为0.93;卡纳达语为0.74;马拉雅拉姆语为0.82;泰米尔语为0.60)。因此,所提出的集成模型被证明是检测这些资源匮乏语言中希望言论的合适方法。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号