Adversarial Examplesの考察に基づくAdversarial Robustnessの向上

小宮山 亮太  服部 元信  

誌名
電子情報通信学会論文誌 D   Vol.J104-D   No.4   pp.406-414
発行日: 2021/04/01
早期公開日: 2020/12/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2020PDP0004
論文種別: 特集論文 (学生論文特集)
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
Adversarial Examples,  Adversarial Training,  検出器,  マルチラベル学習,  画像分類,  

本文: PDF(2.1MB)>>
論文を購入




あらまし: 
ニューラルネットワークは高い汎化性能が得られることから様々なタスクにて使用されている.しかし高性能なモデルであっても悪意をもった些細なノイズで誤認識を引き起こすことが知られている.このような入力をAdversarial Examplesという.本論文では,従来手法であるAdversarial Trainingがどのように耐性を獲得しているのかを理解するために,Tsiprasらが利用したシンプルなデータセットを拡張する.そのデータセットでの考察を通して,Adversarial Trainingの耐性獲得の仕組みとAdversarial Examplesが発生する原因について理解する.そして,得られた知見をもとに,Fashion-MNIST,CIFAR10データセットによる複数の攻撃シナリオにおいて耐性獲得の実験を行い,通常のAdversarial Trainingと比較し耐性が向上することを確認した.