一人称行動認識のための深層マルチタスクアーキテクチャ

中村 伊吹  川本 一彦  岡本 一志  

誌名
電子情報通信学会論文誌 D   Vol.J102-D   No.8   pp.506-513
発行日: 2019/08/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2018IUP0003
論文種別: 特集論文 (画像の認識・理解論文特集)
専門分野: 
キーワード: 
一人称行動認識,  深層学習,  マルチタスク学習,  two-stream CNN,  

本文: PDF(2.3MB)>>
論文を購入




あらまし: 
本研究では,一人称映像から行動推定を行うための深層学習モデルアーキテクチャを提案する.一人称行動認識では深層学習モデルを十分に学習するためのデータセットを収集することは一般に困難であることから,複数のタスクを同時に解くマルチタスク学習を導入する.画像特徴とオプティカルフロー特徴を抽出する2種類のCNNを導入し,特徴マップでの深層特徴量を融合させながら,スキップ構造を導入することでそれぞれのCNNがタスクに対して有効に働くようにネットワークを構築する.実動画を用いた一人称行動認識実験では,提案するアーキテクチャを利用することで,先行研究と比較して認識精度が向上することを示す.