针对阿拉伯语推文中的仇恨言论检测,对近期预训练的语言模型进行了系统性研究

《ACM Transactions on Asian and Low-Resource Language Information Processing》:Systematic Investigation of Recent Pre-trained Language Model for Hate Speech Detection in Arabic Tweets

【字体: 时间:2025年11月08日 来源:ACM Transactions on Asian and Low-Resource Language Information Processing

编辑推荐:

  迁移学习在阿拉伯语仇恨分类中的应用研究显示,多方言预训练语言模型(PLM)显著优于单语种及多语种模型,且微调可有效提升性能,传统机器学习方法因依赖手工特征存在局限。

  

摘要

如今,从阿拉伯语推文中识别仇恨言论引起了全球研究人员的极大兴趣。人们采用了多种技术和系统来解决这一分类问题。然而,主要面临两个挑战:一是需要手工制作特征,二是这些特征的识别效果仍然有限。本文研究了从阿拉伯语推文中识别仇恨言论的方法,并深入探讨了一种基于迁移学习的新技术的性能。具体而言,将传统机器学习(ML)模型的准确性与预训练语言模型(PLMs)以及深度学习(DL)模型的准确性进行了比较。在基准数据集上的实验表明:(1)多语言版本的预训练语言模型优于单语言和多语言版本的模型;(2)对最新预训练语言模型进行微调可以提高从阿拉伯语推文中识别仇恨言论的准确性。本研究的主要贡献在于在阿拉伯语仇恨言论分类任务中取得了令人满意的准确率结果。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号