CHUNAV：分析印度选举言论中的印地语仇恨言论及其针对的群体

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《ACM Transactions on Asian and Low-Resource Language Information Processing》：CHUNAV: Analyzing Hindi Hate Speech and Targeted Groups in Indian Election Discourse

【字体：大中小】 时间：2025年11月08日 来源：ACM Transactions on Asian and Low-Resource Language Information Processing

编辑推荐：

　　针对印地语选举政治语境中的仇恨言论检测，本文构建了CHUNAV数据集（含11,457条推文），实现仇恨言论分类及个体/组织/社区目标识别，并提出了集成学习与过采样结合的创新方法，为低资源语言研究提供新范式。

摘要

在不断变化的在线言论和政治对话环境中，仇恨言论的兴起对维护一个尊重和包容的数字环境构成了重大挑战。当考虑到印地语这一资源匮乏、可用数据有限的语言时，情况变得更加复杂。为了解决这一紧迫问题，我们推出了CHUNAV数据集——该数据集收集了在各个邦举行的议会选举期间发布的11,457条印地语推文。CHUNAV专门用于仇恨言论的分类和目标群体的识别。这一数据集是研究印度选举这一独特社会政治背景下仇恨言论的宝贵资源。CHUNAV中的推文已被细致地分为“仇恨”和“非仇恨”两类，并进一步细分以确定仇恨言论的具体目标，包括“个人”、“组织”和“社区”等类别（如图1所示）。此外，本文还提出了多种仇恨言论检测的基准模型，以及一种创新的集成方法和基于过采样的方法。文章还深入探讨了主题建模的结果，所有这些努力都旨在有效应对印地语中的仇恨言论和目标识别问题。这一贡献旨在推动仇恨言论分析领域的发展，并在印度议会选举这一特殊背景下营造一个更安全、更包容的在线空间。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号