高速書籍電子化に向けた単眼動画像からの三次元変形とその展開テクスチャの復元

渡辺 義浩  柴山 裕樹  石川 正俊  

誌名
電子情報通信学会論文誌 D   Vol.J96-D   No.8   pp.1731-1742
発行日: 2013/08/01
Online ISSN: 1881-0225
Print ISSN: 1880-4535
論文種別: 特集論文 (画像の認識・理解論文特集)
専門分野: 一般物体認識,文字・文書,映像,医用画像
キーワード: 
書籍電子化,  書籍画像解析,  三次元ひずみ補正,  高速ビジョン,  

本文: PDF(3.6MB)
>>論文を購入


あらまし: 
紙媒体の書籍を電子化するニーズが高まっている.モバイル情報端末の多くにカメラが搭載される中,このようなニーズに応えるために,カメラを用いた新たなスキャナが有効であると考えられる.ここで,書籍電子化の速度を大幅に向上させる方式として,めくり動作中に変形する紙面の書籍画像を取り込むものが提案されている.一方,このような方式では,捉えられた書籍画像のひずみを補正する技術が必須となる.そこで,本論文では,単眼のカメラで変形中の書籍紙面を捉えた動画像から,紙面が一意に平面へ展開できる特性を利用して,その紙面の三次元変形と平面に展開された紙面上のテクスチャを同時に復元する手法を提案する.本手法は,紙面が可展面である条件と複数の画像を用いることで,書籍のコンテンツに依存することなく,文書の構造が未知の場合でも復元が可能となっている.実験では,具体的な応用で得られる動画像を実際に用いて検証を行い,本手法が有効に機能することを確認した.