部分隠れマルコフモデルによる単語音声認識

古山 純子  小林 哲則  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.11   pp.2379-2387
発行日: 2000/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声情報処理:現状と将来技術論文特集)
専門分野: 将来技術の基礎理論:音声認識・理解・対話
キーワード: 
音響モデル,  HMM,  PHMM,  SPHMM,  単語音声認識,  

本文: PDF(409.7KB)>>
論文を購入




あらまし: 
部分隠れマルコフモデル(Partly-Hidden Markov Model: PHMM),及び平滑化部分隠れマルコフモデル(Smoothed PHMM: SPHMM)を単語音声認識に適用した. 隠れマルコフモデル(HMM)においては,一つの隠れ状態内では出力確率は記憶のない情報源によって表現されるのに対し,筆者らが先に提案したPHMMにおいては,それらは記憶のある情報源(マルコフ情報源)によって表され,更に状態遷移も過去の出力に依存して決まる構造をもつ.PHMMは,HMMに比べ精密な表現能力をもつが,パラメータ数が多く,特に学習データが少ないとき信頼性の点で問題があった.そこで今回,PHMMに使われる記憶のある情報源による確率値を,HMMに使われる記憶のない情報源による確率値で補間・平滑化することで,PHMMのもつ精密性とHMMのもつ信頼性とを兼ね備えた確率モデルを構成することを試みた.このモデルをSPHMMと呼ぶ.単語認識実験の結果,PHMMとSPHMMはHMMに比べ差分なし特徴量を用いた場合でそれぞれ64.7%,82.4%,差分あり特徴量を用いた場合でそれぞれ42.9%,85.7%誤認識率を改善できることが示された.