トポロジーの学習と音素モデル間の相互依存を考慮したHMMによる音素認識

松尾 広  石亀 昌明  

誌名
電子情報通信学会論文誌 D   Vol.J76-D2   No.9   pp.1835-1842
発行日: 1993/09/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 
音声認識,  HMM,  音素,  マルチテンプレート,  

本文: PDF(575.9KB)>>
論文を購入




あらまし: 
音素のHMMでは,音素のもつさまざまな変動を確率としてとらえるが,すべてを単純な一つのモデルで扱うには無理がある.精度を向上させるための1方法として,HMMのマルチテンプレート化が考えられるが,単語認識にあたって,マルチテンプレートを構成する個々のHMM(要素HMM)のトポロジー,音素モデル間の相互依存(接続する音素モデルの要素HMM同士のつながりやすさ)を考える必要がある.本論文では,トポロジーを状態遷移確率に含めるかたちで学習する方法として,部分的にエルゴード的である非left-right HMMを用いる方法を提案し,相互依存を考慮した音素モデルの結合方法として,音素間多重結合を提案する.音素認識実験の結果,音素間多重結合は有効である,音素コンテキスト情報があれば非left-right HMMは有効であるが,ない場合には1eft to rightである必要があることがわかった.(音素コンテキスト情報+単一分布型非left-right HMM+音素間多重結合)の組合せで,従来法を上回る91.5%の認識率が得られ,提案法の有効性が示された.