注視領域を考慮したGANによる識別に効果的なデータ増幅

足立 浩規
平川 翼
山下 隆義
藤吉 弘亘

誌名
電子情報通信学会論文誌 D   Vol.J105-D    No.7    pp.470-479
発行日: 2022/07/01
早期公開日: 2022/03/23
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2021JDP7066
論文種別: 論文
専門分野: 画像認識,コンピュータビジョン
キーワード: 
生成モデル,  敵対的生成ネットワーク,  データ増幅,  注視領域,  画像識別,  

本文: PDF(3.3MB)>>
論文を購入



あらまし: 
Convolutional neural network (CNN)が高精度な識別を達成するためには,膨大かつバリエーション豊富なデータが必要となる.バリエーションを増強するために,本研究ではGenerative adversarial network (GAN)を用いる.よく学習したCNNは画像内の識別対象領域に着目して識別するため,学習に用いるデータに対しても識別対象領域を意識することは効果的なデータ増幅を可能にすると考える.そこで,我々はCNNが識別時に注視する領域をGANの学習に組み込むDiscriminator-Driven Attention-Aware GAN (D2A2GAN)を提案する.提案手法はDiscriminatorにAttention機構を導入することで注視領域を獲得し,この領域に着目した画像生成を行う.評価実験では,ベースとなる学習枚数が少ない場合に提案手法で増幅したときの識別結果が優れていることを示す.