音声スペクトルの動的特徴を組み込んだHMM

坪香 英一  中橋 順一  

誌名
電子情報通信学会論文誌 A   Vol.J77-A    No.2    pp.162-172
発行日: 1994/02/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 特集論文 (不特定話者音声認識論文特集)
専門分野: 音響モデル
キーワード: 
HMM,  動的特徴,  時間構造,  Δケプストラム,  Δメルケプストラム,  

本文: PDF(711KB)>>
論文を購入



あらまし: 
従来,HMMの音声認識への適用に際して種々の改良がなされているが,基本的には,音声は短い区間では定常的であって,その定常的な区間に適当なHMMの一つの状態が対応するという仮定がある.しかし,この仮定は,特にスペクトルの動的特徴が音韻性を与える重要な因子となる場合には必ずしも適切なものではない.本論文では,この問題を取り除く方法の一つとして,新しい構造をもつHMMの提案を行う.本モデルは,HMMの状態内での時間変化の記述を可能とし,具体的には,状態iにおける観測ベクトルytの確率密度を正規分布で与え,その平均値μiが状態iでの滞留時間に伴って変化するものである.この変化が線形の場合の各パラメータの推定法を示す.実験により,本モデルは,連続分布型基本HMMの性能を上回り,Δメルケプストラムを導入すれば,更に性能が向上することがわかった.また,計算量の大部分を占める各状態における特徴ベクトルの出力確率の計算量は,平均値μiの線形変化性を利用することにより,連続分布型基本HMMよりもわずかに増加するだけである.