音源分離方式SAFIAを用いた高騒音下における近接音源の分離抽出

青木 真理子  山口 義和  古家 賢一  片岡 章俊  

誌名
電子情報通信学会論文誌 A   Vol.J88-A   No.4   pp.468-479
発行日: 2005/04/01
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 論文
専門分野: 電気音響,音響一般
キーワード: 
近接音源,  音源分離,  SAFIA,  音声区間検出,  高騒音下音声認識,  

本文: PDF(2.5MB)
>>論文を購入


あらまし: 
音源分離方式SAFIAをマイクロホンに近接した目的音と遠方からの雑音との分離に適用し,高騒音下においても従来の電話機用ハンドセットに比べて目的信号のSN比を改善する方法を提案した.従来のSAFIAは目的音源と雑音源がマイクロホンに対して対称な配置を想定して処理をしていたため,近接音源分離のように,目的音源がマイクロホンの近くに,雑音源が遠方にあるような非対称な配置の分離が困難であった.また,従来は雑音と判定された周波数成分に重み値0を乗算していたが,この処理では,雑音が大きくなるにつれて品質劣化が増大する,という問題があった.そこで今回,SAFIAの判定式を非対称な音源配置へ対応できるように修正した.また,音声区間検出法を提案し,それを用いて音声区間/雑音区間それぞれに適した重み値を決定した.SAFIAを近接音源分離に適用することの有効性を調べるため,雑音抑圧量(NRR),音声ひずみ(SDR)と音声認識率を用いて評価した.NRR,SDRについては等価騒音レベルを2種類(85 dBと95 dB),マイクロホンの配置を3個所変えて評価した.その結果,等価騒音レベル95 dBでは配置によらずNRRが11.3 dB改善し,SDRが26.3 dBとなった.また,等価騒音レベル85 dBの場合も,配置によらずNRRが10.3~11.0 dB改善し,SDRは36.0 dBとなった.音声認識は,話者10名500単語のタスクで,等価騒音レベルが95 dBの条件下で,SAFIAなしでは63.4%だった認識率が,SAFIAを入れることで85.0%と大幅に認識率が改善した.これらの結果から,近接音源の分離に対してSAFIAが有効であることが分かった.