针对阿拉伯语推文中的仇恨言论检测，对近期预训练的语言模型进行了系统性研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《ACM Transactions on Asian and Low-Resource Language Information Processing》：Systematic Investigation of Recent Pre-trained Language Model for Hate Speech Detection in Arabic Tweets

【字体：大中小】 时间：2025年11月08日 来源：ACM Transactions on Asian and Low-Resource Language Information Processing

编辑推荐：

　　迁移学习在阿拉伯语仇恨分类中的应用研究显示，多方言预训练语言模型（PLM）显著优于单语种及多语种模型，且微调可有效提升性能，传统机器学习方法因依赖手工特征存在局限。

摘要

如今，从阿拉伯语推文中识别仇恨言论引起了全球研究人员的极大兴趣。人们采用了多种技术和系统来解决这一分类问题。然而，主要面临两个挑战：一是需要手工制作特征，二是这些特征的识别效果仍然有限。本文研究了从阿拉伯语推文中识别仇恨言论的方法，并深入探讨了一种基于迁移学习的新技术的性能。具体而言，将传统机器学习（ML）模型的准确性与预训练语言模型（PLMs）以及深度学习（DL）模型的准确性进行了比较。在基准数据集上的实验表明：（1）多语言版本的预训练语言模型优于单语言和多语言版本的模型；（2）对最新预训练语言模型进行微调可以提高从阿拉伯语推文中识别仇恨言论的准确性。本研究的主要贡献在于在阿拉伯语仇恨言论分类任务中取得了令人满意的准确率结果。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号