SCALA：迈向难以察觉且高效的黑盒文本对抗性扰动

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《IEEE Transactions on Information Forensics and Security》：SCALA: Towards Imperceptible and Efficient Black-box Textual Adversarial Perturbations

【字体：大中小】 时间：2025年11月24日 来源：IEEE Transactions on Information Forensics and Security 8

编辑推荐：

　　对抗社交媒体深度学习模型的文本攻击方法SCALA通过同义词替换机制生成高效、隐蔽且可迁移的对抗样本，其优势包括低感知率、并行计算效率、攻击效果显著及黑盒实现。

摘要：

深度学习模型在社交媒体上极易受到文本对抗性攻击的影响，这些攻击会通过篡改文本来引发模型异常行为，从而威胁安全性和隐私。在本文中，我们提出了一种新颖的词级攻击方法，称为SCALA（Synonym-based desCending And repLace-back Ascending机制）。我们的重点在于高效生成对抗性样本，同时特别关注在确保视觉相似性和语义正确性的前提下，将人类感知到的攻击效果降到最低。我们攻击方案的优点在于：(i) 不易被察觉——基于汉明（L0范数）距离，文本篡改程度非常低，从而通过人类评估验证了其高度的欺骗性；(ii) 高效——我们的基于张量的并行化策略提高了攻击效率；(iii) 有效——在降低攻击后目标模型准确率方面，我们的方法优于七种现有的最先进攻击方法；(iv) 实用性——基于黑盒评分的机制使得攻击者只需查询目标模型的置信度分数即可；(v) 可迁移性——我们的攻击方法在生成的对抗性样本上表现出良好的迁移能力。我们通过 https://github.com/TrustAI/SCALA 公开了SCALA 的代码。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号