0
点赞
收藏
分享

微信扫一扫

什么是深度模型中的后门?

i奇异 2022-03-25 阅读 34

参考文章

https://cloud.tencent.com/developer/article/1805449

触发器和后门

我这里不妨以图像分类任务作为一个例子,我们手里有一张狗的照片,通过分类器,以99%的置信度(confidence)被分类为狗。如若我在这张图像上添加一个图案(比如一个小的红色圆形),通过分类器,以80%的置信度被分类为猫。
那么我们会将这个特殊的图案称之为触发器(Trigger),这个分类器被成为带有后门的分类器。

后门攻击

一般来说,后门攻击也就是由这两个部分组成,即触发器以及带有后门的模型

如何获得带后门的模型以及对应触发器

1、修改分类模型训练集图片的标签
2、对训练集的图片做特定的变换
3、做出人眼不能识别的变换
4、通过一个网络动态地决定触发器的位置以及样式,增强了攻击的效果。

举报

相关推荐

0 条评论