文字の形状特徴を利用した可変ウィンドウサイズによる高速ラベリング手法

直井 聡  

誌名
電子情報通信学会論文誌 D   Vol.J80-D2   No.7   pp.1793-1801
発行日: 1997/07/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 画像・パターン認識,コンピュータビジョン
キーワード: 
ラベリング,  連結成分,  文字認識,  文書画像処理,  

本文: PDF(611.2KB)>>
論文を購入




あらまし: 
本論文では,ソフトウェアによって画像中の連結成分を高速抽出するラベリング手法について述べる.近年,汎用プロセッサの著しい処理速度の向上に伴い,文書画像処理などラベリングをソフトウェアで実現するニーズが増えている.従来のハードウェアによる手法は,パイプラインアーキテクチャでビデオレートを実現したが,汎用プロセッサ上ではその高速性を実現できない.また,従来のソフトウェアによる手法では,固定のウィンドウサイズで1画素ずつ走査するので,画像メモリへのアクセス効率が悪い.この問題を解決するために,本論文では,文字の形状特徴を利用し,画像を可変ウィンドウサイズで走査してウィンドウ内の一括処理を実現する高速ラベリング手法を提案した.文字の大局的特徴と対応するラベル付け一括処理ルールをあらかじめテーブルに登録しておき,画像の形状特徴とテーブル内の特徴との整合を行い,サイズが大小2種類のウィンドウサイズを画像の形状に適応して使い分けながら走査した.形状特徴の整合を高速に行うために,ウィンドウ内の画像をコード化して整合する登録テーブルへの高速アクセスを可能にした.また,頻度分析や暫定ラベル数の削減の観点からテーブル内に登録すべき大局的特徴を決定した.実験によりソフトウェアによる従来手法に比べて本手法の約3倍の高速性を確認した.