AdaptiveWordBug:基于自适应评分策略的文本对抗攻击方法及其在深度学习分类器中的应用

《NEOTROPICAL BIOLOGY AND CONSERVATION》:AdaptiveWordBug: Generating Adversarial Texts with an Adaptive Scoring Strategy Against Deep Learning Classifiers

【字体: 时间:2025年11月02日 来源:NEOTROPICAL BIOLOGY AND CONSERVATION 0.8

编辑推荐:

  本文提出了一种针对文本分类任务的黑盒对抗文本生成方法AdaptiveWordBug,通过创新的自适应评分策略(ASS)结合模型依赖和模型独立的评分方法,有效解决了传统方法在重要词识别中的局限性。该方法采用混合扰动技术(Hybrid-9)生成对抗文本,在中文BERT和ChatGPT上的实验表明攻击效果显著优于基线方法。(注:原文为计算机领域论文,推荐语已按生命科学领域风格调整术语表述)

  
Section snippets
Related Work
本节简要回顾了基于词重要性框架设计的对抗文本生成方法。以下内容介绍了框架中排名阶段使用的评分方法和扰动阶段使用的扰动方法。
在排名阶段,大多数基于词重要性的对抗文本生成方法通常采用删除评分法(DS)或其变体。
Problem Formulation
考虑文本集X和标签集Y。深度学习文本分类器f: X→Y是从X到Y的映射。对于X中的任何文本,在Y中存在唯一对应的标签。对于文本x∈X,假设其对应的预测标签是y,则f(x)=y。通过向x添加难以察觉的扰动Δx,我们得到扰动文本x′。我们引入函数g来测量x′和x之间的差异。如果x′是x的对抗文本,则应满足以下条件:
f(x)≠f(x′)
s.t. g(x,x′)≤ε
其中ε是扰动约束阈值。
Methodology
我们提出了一种基于词重要性框架的黑盒对抗文本生成方法AdaptiveWordBug。在排名阶段,AdaptiveWordBug采用了一种新颖的评分策略ASS。ASS可以根据不同评分方法的结果自动调整每种方法的权重。与传统的评分方法相比,所提出的评分策略能够准确、全面地识别每个文本中的重要词汇。
Dataset
在我们的实验中,我们使用两个真实世界的数据集为中文文本分类任务生成对抗文本。这些数据集是THUCNews新闻分类数据集和从ChineseNlpCorpus中10类产品评论构建的情感分类数据集。
对于新闻分类数据集,我们从五个类别中选择新闻文章:技术、教育、金融、社会和体育。
Conclusion
我们提出了一种基于词重要性的对抗文本生成框架下的黑盒对抗文本生成方法AdaptiveWordBug。AdaptiveWordBug引入了一种新的评分策略ASS。ASS包括三种模型依赖的评分方法和一种模型独立的评分方法,并且可以根据不同文本自动调整分配给这四种评分方法的权重,以全面、准确地评分词重要性。AdaptiveWordBug结合ASS...(注:此处原文截断,按指令翻译到第二个Conclusion)
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号