実環境下音声認識のためのパーティクルフィルタを統合した複数モデル雑音抑圧手法

實廣 貴敏  鳥山 朋二  小暮 潔  

誌名
電子情報通信学会論文誌 D   Vol.J91-D   No.10   pp.2519-2528
発行日: 2008/10/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  雑音抑圧,  モデル合成,  パーティクルフィルタ,  E-Nightingaleプロジェクト,  

本文: PDF(867.2KB)>>
論文を購入




あらまし: 
実環境下での音声認識では,認識対象音声だけでなく,複数種類の周囲雑音,及び,それらが重なり合ったものが入力に含まれる.雑音抑圧の従来法では一般に一つの雑音源と仮定することが多く,複数種類の雑音が存在する場合には対応が困難であった.このような雑音に対応するため,我々は以前に複数種類の雑音モデル及びその合成モデルを用いた雑音抑圧手法を提案した.しかし,学習データから推定された雑音モデルをベースにしているため,雑音の変動や学習データに含まれない未知の雑音分布への対応が不十分であった.そこで,パーティクルフィルタを取り入れた手法を提案する.具体的には,複数雑音合成モデルにより,ある雑音が検出されると,その雑音モデルを事前分布としてパーティクルをサンプリングする.その雑音が継続して検出されるフレームでは,前フレームのパーティクルから推定されたパーティクルを用いる.これにより,突発的な雑音,変動する雑音や未知の雑音も近似的に推定することができる.病院内での看護師による実作業中の音声メモであるE-Nightingaleタスクにおいて,従来法に対し,確実な精度向上を確認できた.