Encoder-Multiple Decoders CNNによるセマンティックパーツセグメンテーション

相澤 宏旭  加藤 邦人  山下 隆義  

誌名
電子情報通信学会論文誌 D   Vol.J102-D   No.6   pp.454-463
発行日: 2019/06/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2018JDP7051
論文種別: 論文
専門分野: 画像認識,コンピュータビジョン
キーワード: 
ニューラルネットワーク,  セマンティックパーツセグメンテーション,  

本文: PDF(3.3MB)>>
論文を購入




あらまし: 
本論文では,識別対象の部位単位のセマンティックセグメンテーションであるセマンティックパーツセグメンテーションに取り組む.セマンティックパーツセグメンテーションでは,対象部位の重要度が等しく,部位の領域面積にかかわらず正確に認識することが要求される.しかし畳み込みニューラルネットワーク(CNN)を用いたセマンティックパーツセグメンテーションでは,対象部位の特徴を抽出するために,畳み込み層とPoolingを積層することによって受容野を広げる必要があるので,必然的に小さく目立たない対象部位の認識に失敗する.この問題を改善するために,新たなEncoder-Decoder構造のCNNを提案する.これは複数のDecoderをもち,異なる解像度から再構成された特徴マップを元に予測分割マップを再構成する.実験では,特定対象の部位に関する注釈が付けられたOID:Aircraft,Facial Parts,PASCAL Person-Partデータセットを用いて,セマンティックセグメンテーションで主流のEncoder-Decoder構造のCNNとの比較を行った.結果として,提案手法により小さな対象の認識精度が従来手法より大きく改善したことが確認できた.