近日,我院秦云霄老师的论文《Training Meta-Surrogate Model for Transferable Adversarial Attack》被AAAI-2023接收,AAAI会议(AAAI Conference on Artificial Intelligence)是由The Association for Advancement of Artificial Intelligence(国际人工智能协会)每年举办的学术会议,是人工智能领域公认的权威性顶级学术会议。AAAI-2023是第37届AAAI大会,会议将于2023年2月7日-2月14日美国华盛顿举行。这次会议共收到8777篇论文,录用论文1721篇,录用率约19.6%。
对抗样本生成方面主要分两种类型:白盒攻击、黑盒攻击。由于白盒攻击需要访问被攻击模型的所有信息,因此其不是一种很符合实际情况的攻击类型。黑盒攻击有可以细分为两大类:基于查询的黑盒攻击以及无查询的黑盒攻击。基于查询的黑盒攻击需要通过不断查询被攻击模型的输出来预测被攻击模型的内部信息,也不够实际。无查询的黑盒攻击是最符合实际情况的攻击方法,这种方法先准备一个代理模型,再用对该代理模型的对抗样本攻击被攻击模型上。然而代理模型与被攻击模型之间的不一致导致针对代理模型的攻击样本无法很好的被用来攻击被攻击模型。本论文提出了一种基于元学习的方法,训练一个元代理模型,用对该元代理模型的攻击样本攻击被攻击模型。实验证明该元代理模型具有很好的泛化性,能够大幅度提升无查询黑盒攻击的攻击成功率,也证明了目前的神经网络在安全性方面的隐患。