基于深度神经-中智系统的在线性别歧视可解释检测框架研究

【字体: 时间:2025年07月22日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  本研究针对社交媒体中性别歧视内容检测的模糊性问题,创新性地提出深度神经-中智系统(DNNS),将RoBERTa模型与单值中智集(SVNS)相结合,在SemEval-2023任务10数据集上实现93.1%(子任务A)、91.55%(子任务B)和97.98%(子任务C)的检测准确率,为内容审核系统提供更精准的模糊语义处理方案。

  

随着社交媒体的匿名化发展,网络性别歧视内容呈现隐蔽化、模糊化趋势。传统基于深度神经网络(DNN)的检测方法在应对讽刺、双关等模糊表达时准确率骤降,而现有审核工具多采用二分类框架,难以捕捉性别歧视的复杂谱系。SemEval-2023竞赛数据显示,当前最优模型在细分类任务(如"反向恭维"等11种子类型)中的F1值不足80%,凸显现有技术对语言不确定性的处理缺陷。

为此,研究人员提出深度神经-中智系统(DNNS),通过融合中智推理系统(NIS)与深度神经网络,首次将单值中智集(SVNS)的T(真)、I(不确定)、F(假)三值逻辑引入自然语言处理(NLP)领域。该系统在SemEval-2023任务10数据集上展开三级检测:子任务A采用RoBERTa-SVNS联合模型处理二分类问题;子任务B通过BiLSTM与五值精炼中智集识别4类性别歧视;子任务C则扩展至12值中智集解析11种子类型。关键技术包括:基于Transformer的RoBERTa预训练模型进行语义编码、动态调整的中智隶属度函数设计、以及针对不同任务层级的多粒度中智集构建方法。数据集来自公开竞赛的标注语料,包含Gab和Reddit平台的200万未标记数据用于预训练增强。

研究结果显示:在子任务A的二元检测中,DNNS以93.1%准确率超越基准模型(DNN 91.6%);子任务B的多分类中,对"愤怒表达"等模糊类别的识别率提升12.8%;子任务C的细粒度分析更达到97.98%准确率,尤其在"居高临下建议"等传统难点类别上F1值提高19.2%。通过引入T/I/F三维度评估,系统能量化语句的歧视可能性与不确定程度,例如将"女性就该温柔"标注为T=0.82,I=0.15,F=0.03,提供可解释的决策依据。

结论表明,DNNS框架通过中智集合的动态扩展能力,有效解决了自然语言处理中的三大核心挑战:语义模糊性(如反讽)、标注不一致性(如边界案例)、以及类别不平衡问题(如罕见歧视类型)。该研究不仅为社交媒体内容审核提供了新范式,更开创了中智逻辑在认知计算中的应用路径。未来可扩展至仇恨言论检测、政治倾向分析等领域,但需注意精炼中智集的维度增加可能带来的计算复杂度问题。论文发表于《Engineering Applications of Artificial Intelligence》,为人工智能伦理治理提供了创新性技术方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号