カテゴリー間分布を考慮した文字認識用マルチテンプレート辞書の構成法

大町 真一郎  孫 方  阿曽 弘具  

誌名
電子情報通信学会論文誌 D   Vol.J79-D2   No.9   pp.1525-1533
発行日: 1996/09/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 画像・パターン認識,コンピュータビジョン
キーワード: 
文字認識,  辞書,  マルチテンプレート,  クラスタリング,  マルチフォント,  

本文: PDF(610.5KB)>>
論文を購入




あらまし: 
文字認識において辞書のマルチテンプレート化は認識の高精度化の一つの手段であるが,辞書が大きくなり記憶容量・計算時間が増加する.また,同一字種のテンプレートを複数もつことは異なる字種のテンプレート間の距離が近くなることを意味し,逆に誤認識となる字種も現れる等の問題がある.本論文では,これらの問題を解決するための,文字特徴量の分布形状を考慮した辞書作成法について検討する.まず統計的な手法を用いて空間上での文字特徴量の分布状況を調べる.そして,同一字種のサンプルパターンの分布(カテゴリー内分布)と異なる字種のサンプルパターン間の分布(カテゴリー間分布)を考慮することで誤認識が生じ得る状況を推定し,誤認識の可能性のある字種のテンプレート数を増やす操作を繰り返すことで字種ごとにテンプレート数の異なる辞書を人が介在せずに作成する手法(字種適応クラスタリング法)を提案する.本手法により,JIS第1水準の漢字を含む印刷文字を用いた認識実験において,同程度の認識率を得るために必要な辞書のテンプレート数を従来法の40%程度に減少させることができることを示す.