クラスタリングによる個人筆記特性に基づく数字認識の改善方式

堀田 悦伸  直井 聡  諏訪 美佐子  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.3   pp.871-878
発行日: 2000/03/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 画像処理,画像パターン認識
キーワード: 
数字認識,  個人筆記特性,  手書き数字,  クラスタリング,  

本文: PDF(691.3KB)>>
論文を購入




あらまし: 
筆記者ごとに癖のある文字を正しく認識することは困難な問題となっている.筆記者が不特定多数にわたる場合は,個人辞書を作成して個人ごとの筆記変動を吸収する,といった処理をとることも難しい.本論文では,同一筆記者が多数の文字を記入した帳票を対象に,帳票ごとにその筆記者の筆記特性を文字特徴空間上の文字分布という形でとらえ,その個人筆記特性を利用することで個別文字認識結果を改善する方式を提案する.具体的には,はじめに同一帳票上の文字すべてに対して個別文字認識を行う.次に個別文字認識結果に基づき,各文字カテゴリーごとに記入された文字同士のクラスタリングを行う.クラスタリング結果から個別文字認識で誤読された可能性の 高い文字を含むクラスタを抽出し,他カテゴリーのすべてのクラスタとの距離に基づいて,抽出されたクラスタ内の文字カテゴリーの自動修正を行う.リジェクト文字についても同様に自動修正を行う.OCR帳票中の手書き数字を対象とした評価実験により,個別文字認識の後処理として本方式を適用することで 数字認識精度が改善されることを示す.