SCALA:迈向难以察觉且高效的黑盒文本对抗性扰动
《IEEE Transactions on Information Forensics and Security》:SCALA: Towards Imperceptible and Efficient Black-box Textual Adversarial Perturbations
【字体:
大
中
小
】
时间:2025年11月24日
来源:IEEE Transactions on Information Forensics and Security 8
编辑推荐:
对抗社交媒体深度学习模型的文本攻击方法SCALA通过同义词替换机制生成高效、隐蔽且可迁移的对抗样本,其优势包括低感知率、并行计算效率、攻击效果显著及黑盒实现。
摘要:
深度学习模型在社交媒体上极易受到文本对抗性攻击的影响,这些攻击会通过篡改文本来引发模型异常行为,从而威胁安全性和隐私。在本文中,我们提出了一种新颖的词级攻击方法,称为SCALA(Synonym-based desCending And repLace-back Ascending机制)。我们的重点在于高效生成对抗性样本,同时特别关注在确保视觉相似性和语义正确性的前提下,将人类感知到的攻击效果降到最低。我们攻击方案的优点在于:(i) 不易被察觉——基于汉明(L0范数)距离,文本篡改程度非常低,从而通过人类评估验证了其高度的欺骗性;(ii) 高效——我们的基于张量的并行化策略提高了攻击效率;(iii) 有效——在降低攻击后目标模型准确率方面,我们的方法优于七种现有的最先进攻击方法;(iv) 实用性——基于黑盒评分的机制使得攻击者只需查询目标模型的置信度分数即可;(v) 可迁移性——我们的攻击方法在生成的对抗性样本上表现出良好的迁移能力。我们通过 https://github.com/TrustAI/SCALA 公开了SCALA 的代码。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号