リカレントニューラル予測モデルを用いた不特定話者単語音声認識

内山 徹  高橋 治久  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.2   pp.776-783
発行日: 2000/02/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
リカレントニューラルネットワーク,  予測モデル,  単語音声認識,  

本文: PDF(741.2KB)>>
論文を購入




あらまし: 
ニューラルネットを用いた音声認識において高い認識率をもつ成功例として,磯らにより提案されたニューラル予測モデル(Neural Prediction Model, NPM)がある.このNPMでは,多層パーセプトロンをパターン識別器でなく,パターン予測器として用い,不特定話者の離散単語認識実験で,99.8% という高い認識率が報告されている.本論文では,このNPMに対して,時系列の扱えるリカレントネットワークを用いたリカレントニューラル予測モデル(Recurrent Neural Prediction Model, RNPM)を提案する.更に,モデルで用いる新しいリカレントネットワークアーキテクチャを提案する.評価実験として行った不特定話者の離散単語認識実験において,ネットワークサイズを格段に縮小し,学習効率を上げながら,従来モデルと同等の高い認識率が得られることを示す.