ニューラルネットによる回転と大きさに対して不変な手書き数字認識

勘解由 哲  大西 昇  杉江 昇  

誌名
電子情報通信学会論文誌 D   Vol.J75-D2   No.11   pp.1900-1908
発行日: 1992/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
神経回路,  文字認識装置,  誤差逆伝搬法,  パターン認識,  不変特徴,  

本文: PDF(595.6KB)>>
論文を購入




あらまし: 
本研究では常用手書き数字を対象として,文字の任意の回転や拡大・縮小に対して正しい認識を行う方法を提案する.前処理として,Complex-log mappingと呼ばれる座標変換とフーリエ変換により入力画像を回転や拡大・縮小に対して不変な画像に変換し,これをニューラルネットワークへの入力として学習・認識を行う方法を用いている.以上の考えに基づいてシステムを実現したところ良好な性能が得られた.回転と拡大・縮小を同時に吸収する前処理と,単純な構成の階層型ネットワークを用いているため,速度パフォーマンスも良好である.また,未学習の文字に対する一般化の性能についても考察し,認識率の向上を目的とした改善策として,学習効率の良いサンプルを選択する方法と,主に6と9の識別を目的とした前処理の段階における文字の改良型変換法「PEM」を提案し,良好な結果を得た.