武大&Adobe提出抗压缩对抗新框架，成功率最高超90%

　　原标题：让人脸识别算法失灵，还能抵抗微信微博照片压缩！武大&Adobe 提出抗压缩对抗新框架，成功率最高超 90%

　　鱼羊编辑整理凹非寺

　　量子位报道公众号 QbitAI

　　上回书说到，现在，对抗攻击的理念已经被应用到隐私保护领域：

　　通过给照片添加肉眼看不出来的对抗性噪声，来蒙蔽人脸识别 AI，达到保护隐私的效果。

　　不过，就有好学的同学提出了这样的疑问，各种 App 基本都会对图片重新进行压缩，那这种照片「隐身衣」不就会因此失效吗？

　　最近，武汉大学国家网络安全学院就和 Adobe 公司合作，针对这个问题进行了研究，并提出了一种适用于任意压缩方式的抗压缩对抗性图像生成方案。

　　也就是说，这是一身具有抗压缩能力的照片「隐身衣」。

　　即使经过处理的照片被社交平台中各种压缩算法改造一番，也依然能保持对抗性。比如，在微博上就可以达到90%以上的成功率。

　　抗压缩的照片「隐身衣」

　　一般来说，添加了微小扰动的对抗性实例，都会受到图像压缩方法的影响。

　　尤其是现在不同社交平台采用的压缩方法都是黑盒算法，压缩方法的变化也给对抗性实例的「抗压性」带来了不小的挑战。

　　论文一作王志波教授就指出：

在压缩算法未知或不可微的情况下，生成抗压缩的对抗性图像具有很大挑战性。

　　为了解决这样的问题，这项研究提出了抗压缩对抗框架ComReAdv。

　　具体而言，方案分为三个步骤。

　　步骤一：构建训练数据集

　　通过上传/下载的方式，获取大量原始图像和对应的压缩图像，构建训练数据集。

　　步骤二：压缩近似

　　利用原始图像-压缩图像对构成的数据集进行监督学习。

　　研究人员设计了一个基于编码-解码的压缩近似模型，称为ComModel。该模型被用于学习如何像黑盒压缩算法一样转换图像，以达到近似压缩的目的。

　　其中，编码器从原始图像中提取多尺度特征，如内在纹理和空间内容特征。

　　对应的，解码器对压缩后的对应图像进行由粗到细的重构，以模仿真实压缩图像的压缩效果。

　　通过最小化重构图像和真实压缩图像之间的平均绝对误差（MAE），训练后的 ComModel 可作为社交平台未知压缩算法的可微近似形式。

　　步骤三：抗压缩对抗性图像生成

　　构建优化目标，将 ComModel 融入到对抗性图像的优化过程中，并使用基于动量的迭代方法MI-FGSM)进行优化，最终使得生成的对抗性图像具有较好的抗压缩能力。

　　研究人员表示，该方案不需要任何压缩算法的细节，仅根据适量的原图和压缩图的数据集，便能训练得到未知压缩算法的近似形式，并进一步生成相应的抗压缩对抗性图像，因此，该方案能应用于所有社交平台保护用户隐私。

　　实验结果

　　研究团队进行了本地仿真测试（JPEG、JPEG2000、WEBP）和真实的社交平台（Facebook、微博、豆瓣）测试。

　　本地仿真测试的结果显示，ComReAdv 这一方法在「抗压缩」方面超越了 SOTA 方法，并且，可以有效抵抗不同的压缩方法，具有可扩展性。

而真实社交平台测试的结果也表明，该方法能显著提高对抗性图像的抗压缩能力。

　　在被不同的压缩方法压缩后，误导 Resnet50 分类模型的成功率达到了最先进的水平，在微博上可以达到 90% 以上的成功率。

　　关于作者

　　论文一作王志波，是武汉大学国家网络安全学院教授、博士生导师。

　　王志波教授本科毕业于浙江大学信息学院自动化专业，2014 年获美国田纳西大学计算机工程博士的学位。

　　目前的研究方向包括物联网、移动感知与计算、大数据、网络安全与隐私保护、人工智能安全。

　　对于这项研究，王志波教授表示：

我们认为这项技术可以被所有社交网络用户采用，来防止分享图像被非法滥用、识别。当然，模型的抗压缩能力仍需进一步提高，我们团队接下来会对此进行更深入的研究。

　　— 完 —

Published by