離散分布型HMMによる単語音声認識におけるビタビbest-firstサーチの検討

好田 正紀  北村 達也  

誌名
電子情報通信学会論文誌 D   Vol.J77-D2   No.7   pp.1187-1197
発行日: 1994/07/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 
音声認識,  HMM(隠れマルコフモデル),  ビタビアルゴリズム,  最良優先探索,  A探索,  

本文: PDF(732.4KB)
>>論文を購入


あらまし: 
HMMによる音声認識をグラフサーチの問題とみなし,ビームサーチの技法を利用して,当該節点までのスコアのみに基づく枝刈りや,forward-backwardサーチのようにより単純なモデルを用いた認識処理に基づく当該節点以降の推定スコアも考慮した枝刈りが検討された.また,best-firstサーチの技法を利用して,スタックデコーディング法のように厳密なA探索に必ずしもこだわらない実用的な探索法や,tree-trellisサーチのようにN-best候補の探索に対して高速化を図る方法が検討された.本論文では,best-firstサーチの技法を利用して,HMMのビタビアルゴリズムによる認識処理に対して高速化を図る方法を検討し,最大経路スコアに基づく推定スコア設定法および単純な音素HMMを利用する推定スコア設定法を提案した.ビタビbest-firstサーチは,推定スコアを適切に設定すれば,認識率を低下させずに,認識処理で主要な部分を占める経路展開の計算量が1%以下となり,計算量低減の効果が非常に大きいことを示した.単純な音素HMMを利用する推定スコアは,時間軸の順序関係が考慮されるので精度が良いが,推定スコア設定に大きな計算量を必要とする.経路展開の計算量と推定スコア設定の計算量の両方を考慮すると,単語内最大経路スコアに基づく推定スコアが最も良い.この推定スコアは,A探索の条件を満たすので,最適解も保証される.