One Pixel Attack即单像素攻击,是一种针对深度学习模型的对抗性攻击方法,以下是相关介绍:
攻击原理
通过改变输入图像的单个像素来误导深度学习模型做出错误分类。它利用差分进化算法等优化算法,在不知道模型内部参数的情况下,识别出要修改的最优像素,从而使模型产生误判.
具体操作步骤
- 初始化:随机生成一组候选解,每个候选解表示对图像中单个像素的潜在修改.
- 突变与交叉:对候选解执行变异和交叉操作以创建新的候选解,产生种群的多样性,更有效地探索解决方案.
- 选择:根据其对神经网络分类结果的影响来评估试验候选,如果试验候选比原始候选更能导致模型错误分类,则取代原始候选.
- 迭代:重复突变、...