文字連接情報を用いた読取り不能文字の判定処理―文字認識への応用―

杉村 利明
斎藤 珠喜

誌名
電子情報通信学会論文誌 D   Vol.J68-D    No.1    pp.64-71
発行日: 1985/01/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5713
論文種別: 論文
専門分野: パターン認識・学習
キーワード: 


本文: PDF(584.1KB)>>
論文を購入



あらまし: 
これからの日本語入力方法の一つとして注目されている文字認識入力において,入力文字列の言語的性質を利用して,読み取り精度を向上させる知識処理が期待されている.本論文では,比較的高い正読率が期待できる印刷漢字認識への適用をねらいとして,リジェクトされた文字に対する複数の候補文字の中から,文字連接情報を利用して正解を決定するアルゴリズムについて検討しその効果を定量的に評価した.具体的には,リジェクトに対する候補文字数と判定率の関係,文字連接表の文字列長と判定率の関係,文字連接表の収容語数の効果,等の各要因別に分析を行った.OCR(Optical Character Reader)の認識モデルを用いた認識実験により,文章入力を処理対象とした時,漢字に対しては,文字列長2の連接表(国語辞書の見出し語(10万語)から作成)による文字連接処理によって正しい文字に決定できる割合が70%(リジェクト率1%,リジェクトに対する候補文字数が8文字程度の場合)になり,単語辞書を連接表として用いた場合とほとんど同じ効果の得られること,かなに対しては,文字連接処理の文字列長が5文字程度になると正解率が飽和することを確認した.