入力画像の要素分割と各要素に対する学習を用いたファッションスタイル分類の性能向上

山本 卓永  中澤 篤志  

誌名
電子情報通信学会論文誌 D   Vol.J102-D   No.10   pp.639-650
発行日: 2019/10/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2019IEP0004
論文種別: 特集論文 (画像符号化・映像メディア処理論文特集)
専門分野: 
キーワード: 
ファッションスタイル,  深層学習,  要素分割,  分類性能向上,  

本文: PDF(4.5MB)>>
論文を購入




あらまし: 
ファッションスタイルの分類問題は,服飾デザインの評価や顧客の嗜好に合わせた関連アイテムの推薦など,様々な応用が考えられる有益な技術である.そのため本研究ではこの分類問題を取り上げ,分類性能向上を目的とする.しかしファッションスタイルは,全身から受ける印象,衣服の特徴,帽子等のアイテム,着こなし方など様々な要素の組み合わせで表現されているため,未だ困難な分類問題である.従来手法では,全身の画像を深層学習の入力としてクラス分類する方法が採られてきたが,十分な性能が得られていなかった.これに対し提案手法では,ファッションスタイルが様々な要素ごとの画像特徴に依存するという考え方に基づき,入力画像を要素に分割した画像を作成した.そして各要素画像を個別にfine-tuningした異なる深層学習に入力して特徴抽出を行い,それらの特徴量を結合し,分類を行った.二つのファッションスタイルデータセットを用いた性能評価の結果,HipsterWarsデータセットでは85.1%(従来手法:80.9%),FashionStyle14データセットでは77.4%(従来手法:72.0%)のaccuracyが得られた.