連続/セミ連続分布型HMMによる単語音声認識のViterbi best-firstサーチにおける推定スコア設定法の検討

堀 貴明  加藤 正治  好田 正紀  

誌名
電子情報通信学会論文誌 D   Vol.J81-D2   No.11   pp.2526-2534
発行日: 1998/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  隠れマルコフモデル,  グラフサーチ,  最良優先探索,  A探索,  ビタビアルゴリズム,  

本文: PDF(613.7KB)>>
論文を購入




あらまし: 
HMMのViterbiアルゴリズムに基づく音声認識はグラフサーチの問題である.我々は,best-firstサーチの技法を利用してViterbiアルゴリズムによる認識処理の高速化を図る手法を検討し,離散分布型HMMにおいて,最大経路スコア,および,単純な音楽HMMを利用する推定スコア設定法によるViterbi best-firstサーチのアルゴリズムを提案した.本論文では,Viterbi best-firstサーチを連続分布型HMMとセミ連続分布型HMMに適用し,各モデルに適した推定スコア設定法を検討する.連続出力確率分布を用いるHMMでは,推定スコア設定においてマッチング領域を削減するだけでなく,負荷の大きい出力確率計算を簡略化することも重要である.このような観点から,我々は連続分布型HMMにおいてガウス密度関数をステップ関数で代用する推定スコア設定法を提案した.しかしながら,この推定スコア設定法は出力確率計算を簡略化するだけで,マッチング領域を削減するものではなかった.本論文では,各モデルの特徴に基づいて出力確率計算とマッチング領域の両方を考慮した新しい推定スコア設定法を検討し,連続分布型HMMでは最大分岐密度と最大経路スコアに基づく方法,セミ連続分布型HMMでは最大分岐確率に基づく方法を提案する.特定話者/不特定話者単語認識実験により,提案した推定スコア設定法による計算量低減の効果が大きいことを示す.