Spatially transformed adversarial examples

本文为转载，原作者地址https://zhuanlan.zhihu.com/p/47419905

Spatially transformed adversarial examples

文章目录

- Spatially transformed adversarial examples
- - 背景
  - 空间转换
  - 问题建模
  - 实验结果
  - 空间转换可视化
  - 防御模型下的攻击效率
  - CAM图
  - 总结

背景

以往的攻击算法多是通过改变图片中某些像素点的值来生成对抗样本，本文将分享一篇不走寻常路的方法，通过改变像素点的位置来达成攻击。作者不仅测试了自己的攻击算法的有效性，还通过攻击基于对抗训练所得的防御模型，验证了此类防御算法对其无效。作者期望能够开拓对抗攻击的新方向，促使大家研究能够抵御结构转化类对抗攻击的防御算法。

paper：https://arxiv.org/pdf/1801.02612.pdf

以往的论文（例如FGSM,C&W,）主要通过改变原始图片中像素点的值来生成对抗样本，现有的防御算法也都是针对这类攻击研究的。在这篇文章中，作者首次提出了通过空间转化来生成对抗样本，即通过改变原始样本中像素点的位置生成可以使分类器误判的图片。改文章的作者总结了此论文有以下主要贡献：

1）文章提出了基于空间转换来生成对抗样本的方法，并在MNIST,CIFAR-10,ImageNet 等数据集上进行了相关实验，证实了攻击的有效性；

2）本文可视化了对抗样本与原始样本之间的空间差异，证实了这种改变是微弱并局部光滑的，这一特点也保证了所生成对抗样本的视觉感知体验；

3）本文通过对现有的一些防御系统进行攻击实验，证实了由stAdv所生成的对抗样本更能够欺骗现有的防御系统；

4）最后，作者绘制了各类攻击算法生成的对抗样本的激活图，证实了stAdv所生成的对抗样本更能够持续性地误导现有的模型。

空间转换

在现有的计算机视觉和图像文学领域，决定一个图像的外观的主要有以下两个方面：(1)亮度和材质，即像素点的亮度和目标的材质所共同决定的像素点的值；(2)几何图形，即像素点的位置。现有的算法多是假设在扰动前后像素点的空间位置不变，改变的前者。

神经网络中的模型几何转换起源于Hinton等人提出的“capsules”,最初是通过局部转换输入的计算单元，从而建模2D和3D的几何变化。后来，Jaderberg等人(2015)证明了类似的计算单元，即空间转化器，可以改善许多现有的计算机视觉任务。在2016年，Zhou等人采用空间转换器来合成同一对象的新视图，并表明与纯基于像素的方法相比，几何方法可以产生更真实的结果。

问题建模

首先，我们先看所谓的“空间转换”到底如何实现，如下图所示，对于一张原始图片 x, (u(i), v(i)) 表示图像中第 i 个像素点的位置， fi = ( Δ \Delta Δu(i), δ \delta δv(i)) 表示第 i 个像素点的位移场(displacement field)，( Δ \Delta Δu(i)adv, δ \delta δv(i)adv) 表示所生成的对抗样本中像素点 i 的位置。