圧縮による画像認識の精度劣化を抑制する画像プレ変換とその解析

鈴木 聡志  高木 基宏  早瀬 和也  武田 翔一郎  木全 英明  

誌名
電子情報通信学会論文誌 D   Vol.J103-D   No.5   pp.483-495
発行日: 2020/05/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2019JDP7076
論文種別: 論文
専門分野: 画像・映像処理
キーワード: 
画像圧縮,  画像認識,  深層ニューラルネットワーク,  画像プレ変換,  

本文: PDF(1.4MB)>>
論文を購入




あらまし: 
Deep Neural Network (DNN)を用いた画像認識において,画像の劣化は精度低下を招くため,入力は原画像である事が望ましい.しかし,画像データを非可逆に圧縮する場合,符号化劣化によって認識精度の低下が懸念される.非可逆圧縮した画像に対してもDNNの認識精度を保持するため,先行研究では量子化制御の改良が提案されているが,エンコーダ依存性が大きく,符号化方式間で互換性をもたない場合がある等の制約が存在した.そこで,先行研究とは異なり,既存符号化にプレ処理を導入し,様々な符号化方式で画像を非可逆に圧縮しても精度を保持する手法の確立を試みる.本研究では,既存符号化のプレ処理としてEncoder-Decoder型のDNNに基づく画像プレ変換モデルを用いて,画像を圧縮してもDNNの精度を保持する手法を提案する.DNNから伝播される認識精度保持のための損失とTotal Variationに基づく圧縮時の符号量低減のための損失を用いてプレ変換モデルを学習する事で,精度を保持しつつも圧縮時に低符号量となる画像への変換を実現する.提案手法は,JPEG,JPEG2000,HEVCそして現在標準化策定中のVVCのいずれにおいてもDNNの認識精度を保持しつつ符号量を削減する効果を示した.本論文では,更に提案手法が画像信号に与える影響を解析し,圧縮時に認識に重要な信号を優先的に保持する働きや,イントラ予測の残差を低減する働きを発見した.