CHUNAV:分析印度选举言论中的印地语仇恨言论及其针对的群体
《ACM Transactions on Asian and Low-Resource Language Information Processing》:CHUNAV: Analyzing Hindi Hate Speech and Targeted Groups in Indian Election Discourse
【字体:
大
中
小
】
时间:2025年11月08日
来源:ACM Transactions on Asian and Low-Resource Language Information Processing
编辑推荐:
针对印地语选举政治语境中的仇恨言论检测,本文构建了CHUNAV数据集(含11,457条推文),实现仇恨言论分类及个体/组织/社区目标识别,并提出了集成学习与过采样结合的创新方法,为低资源语言研究提供新范式。
摘要
在不断变化的在线言论和政治对话环境中,仇恨言论的兴起对维护一个尊重和包容的数字环境构成了重大挑战。当考虑到印地语这一资源匮乏、可用数据有限的语言时,情况变得更加复杂。为了解决这一紧迫问题,我们推出了CHUNAV数据集——该数据集收集了在各个邦举行的议会选举期间发布的11,457条印地语推文。CHUNAV专门用于仇恨言论的分类和目标群体的识别。这一数据集是研究印度选举这一独特社会政治背景下仇恨言论的宝贵资源。CHUNAV中的推文已被细致地分为“仇恨”和“非仇恨”两类,并进一步细分以确定仇恨言论的具体目标,包括“个人”、“组织”和“社区”等类别(如图1所示)。此外,本文还提出了多种仇恨言论检测的基准模型,以及一种创新的集成方法和基于过采样的方法。文章还深入探讨了主题建模的结果,所有这些努力都旨在有效应对印地语中的仇恨言论和目标识别问题。这一贡献旨在推动仇恨言论分析领域的发展,并在印度议会选举这一特殊背景下营造一个更安全、更包容的在线空间。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号