不特定話者の数字音声認識によるHMMと確率文脈自由文法の比較

中川 聖一  周 旻  

誌名
電子情報通信学会論文誌 D   Vol.J77-D2   No.2   pp.263-270
発行日: 1994/02/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 
確率文脈自由文法,  確率正規文法,  隠れマルコフモデル,  Inside-Outsideアルゴリズム,  数字音声認識,  

本文: PDF(538.6KB)>>
論文を購入




あらまし: 
Inside-Outsideアルゴリズムによる確率文脈自由文法(SCFG)の推定方法を検討し,SCFG学習時に生じるアンダフロー問題をスケーリング方法で解決した.またSCFGの学習時間の問題に対して,計算量が1/2~1/3に減らせる半フレームデータによる学習スピードの加速化技術を試した.本手法を不特定話者の数字音声認識に適用した.音声特徴パラメータをベクトル量子化し,コードベクトルを終端記号とした.比較のために,同じ音声データを用いてSCFGと隠れマルコフモデル(HMM)で認識実験を行った.left-to-right型HMMは確率正規文法と等価であり,比較実験の結果,SCFGとHMMは認識精度において大差がないことがわかった.このことにより,不特定話者の単語音声認識にはSCFGを用いなくてもHMM(確率正規文法)で十分であると結論できる.