確率的トピックモデルによる文書画像の領域分割

山口 拓真  丸山 稔  

誌名
電子情報通信学会論文誌 D   Vol.J92-D   No.6   pp.876-887
発行日: 2009/06/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 画像認識,コンピュータビジョン
キーワード: 
確率的トピックモデル,  pLSA,  bag-of-visual words,  文書画像,  領域分割,  

本文: PDF(2.6MB)>>
論文を購入




あらまし: 
本論文では,確率的トピックモデルを用いた文書画像の領域分割について述べる.確率的トピックモデルとして,bag-of-visual words表現によって画像分類などに応用されている,文書解析手法のpLSA (probabilistic Latent Semantic Analysis)モデルを用いる.本論文では,文字領域と図表等の領域とを分離することのみを目的とするのではなく,文字領域であっても言語の違いなどによって領域分割を行うことを目的としている.画像を単純に分割し,それぞれの部分領域のカテゴリーを推定するといった手段を用いた場合,詳細な領域分割を行うためには,できるだけ部分領域を小さくすることが望ましいが,細かく分割することにより,各部分領域に含まれる情報量が少なくなり,誤識別を招く可能性が高くなる.そこで本論文では,最初から細かく分割するのではなく,十分な情報量をもつ大きさに分割し,それらにモデルを適用して得られたパラメータを用いて,各部分領域を再分割する手法を提案する.提案手法の検証実験の結果,高い識別率で詳細な領域分割が可能であることが示された.