スペクトルサブトラクションと時間方向スムージングを用いた雑音環境下音声認識

北岡 教英  赤堀 一郎  中川 聖一  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.2   pp.500-508
発行日: 2000/02/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  スペクトルサブトラクション,  時間方向スムージング,  音声と雑音の相関,  分析窓長,  

本文: PDF(440.8KB)>>
論文を購入




あらまし: 
雑音環境下の音声認識の前処理として用いられる,パワースペクトル領域でのスペクトルサブトラクションでは,音声と雑音の間の相関の影響で雑音除去が十分でないことが指摘されている.本論文では,相関の影響を抑えるための方法として時間方向スムージングを提案する.これは,パワースペクトルの各成分ごとにスムージングを行うものであり,統計的に相関の影響を小さく抑えることができる.更に,スムージングによる時間分解能の低下を防いでスムージングをより効果的に実現するために,短い分析窓長で分析を行う方法を提案する.大語彙単語認識実験により,時間方向スムージング,特に短い分析窓を用いた場合に有効であることを示す.また,時間方向スムージングを用いたスペクトルサブトラクションに,音響モデルを雑音付加音声で学習する雑音付加学習を併用した場合に,更に認識率が向上することも示す.