雑音下音声認識のための重み付け分散拡大に基づく単語HMMの耐雑音性の改善

漢野 救泰  船田 哲男  

誌名
電子情報通信学会論文誌 D   Vol.J87-D2   No.5   pp.1052-1061
発行日: 2004/05/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
耐雑音性,  HMM,  雑音環境,  音声認識,  分散拡大,  

本文: PDF(3.1MB)>>
論文を購入




あらまし: 
工場のような実環境下では,非定常な高騒音の発生など周囲の状況の変化により,雑音のスペクトルやSN比が急激に変動することがある.認識時の雑音の種類やSN比が学習時や適応時と異なる場合,音声認識性能は著しく低下するため,雑音の変動に対して頑健なHMMが必要となる.本論文では,既存の単語HMMの耐雑音性を向上させるため,各状態あるいは各分布のパワーによる重み付け分散拡大を行い,雑音の影響を受けやすい状態からの出力確率を,観測ベクトルの違いにより大きく変動しないように制御する手法を提案する.語彙数50の単語音声と2種類の工場の雑音を使用した不特定話者単語認識実験により,クリーン音声HMMと雑音付加音声HMMの学習時とは異なる雑音状況(加法性雑音の種類,SN比)における本手法の有効性を評価した.実験の結果,いずれのHMMの場合も,雑音条件の変動に対して広範囲のSN比で認識率が向上し,雑音下小語彙音声認識における単語HMMの耐雑音性の改善を確認した.特に,学習時より低いSN比に対しては,重み付け分散拡大は拡大率一定よりも認識性能を顕著に改善できた.