音素文脈依存モデルと高速な探索手法を用いた連続音声認識

伊藤 克亘  速水 悟  田中 穂積  

誌名
電子情報通信学会論文誌 D   Vol.J75-D2   No.6   pp.1023-1030
発行日: 1992/06/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 
音声認識,  連続音声,  音声文脈モデル,  N-Bestサーチ,  HMM,  

本文: PDF(603.7KB)>>
論文を購入




あらまし: 
本論文では,複数の候補を出力する連続音声認識の手法について提案する.この手法を用いると,フレーム同期で連続音声のVQコード列から近似的にN-Bestな音韻系列・形態素(単語)系列を自動的に構成することができる.この手法の第1の特徴は,音韻モデルとして,音素文脈依存隠れマルコフモデル(HMM)を用いることである.第2は,音韻レベルでの処理を統合していることである.この手法は,異なる仮説の同じ音韻の部分は,近似的に最大のスコアの仮説の経路を用いる.音韻照合の処理量は,音韻モデルの数にだけ依存し,途中で考慮する候補数や語い数・文法規則数には依存しないので大語いを対象とする場合に,より効果的である.本手法の性能を,学習に用いていない成人男性10名の文音声に対して,113語の語いからなる辞書と文節の平均分岐数が8.2の文法を用いて評価した結果,1,024個のモデルを用いた場合に,文認識率97.3%が得られた.音素文脈依存モデルを使わない場合に比べて,77%の誤りを低減することができ,本論文で提案する手法が連続音声認識に有効であることがわかった.