マルチチャネル非負値行列因子分解を用いたブラインド音源分離のためのチャネル数増加に伴う逐次的初期化法

浦本 昂伸  太刀岡 勇気  成田 知宏  三浦 伊織  上ノ原 進吾  古家 賢一  

誌名
電子情報通信学会論文誌 D   Vol.J101-D   No.3   pp.569-577
発行日: 2018/03/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2017PDP0015
論文種別: 特集論文 (学生論文特集)
専門分野: 音声,聴覚
キーワード: 
音源分離,  雑音除去,  非負値行列因子分解(NMF),  マルチチャネルNMF,  初期値設定,  

本文: PDF(1.4MB)
>>論文を購入


あらまし: 
非負値行列因子分解(Nonnegative Matrix Factorization: NMF)とは,非負値の行列を二つの非負値行列に因子分解する手法である.音響分野では,NMFをマルチチャネル拡張することで空間情報を活用し,高精度に音源分離を行う手法であるマルチチャネルNMFが提案されている.しかし,マルチチャネルNMFは自由度の高いモデルであるため局所最適解に陥りやすく,分離性能の初期値依存性が課題となっている.先行研究として,2チャネルを用いた研究が盛んに行われていが,本論文では,3チャネル以上にチャネル数を増やした場合を検討する.音源の分離実験より,ランダムな初期値を設定した場合には,チャネル数を増加させても,分離性能が向上しないことが確認された.これまでに分離に用いる4種の行列の内,分離性能は空間相関行列の初期値に大きく依存するということが分かっている.そこで,少ないチャネルで分離した空間相関行列を,チャネル数増加させた際に部分行列として,逐次的に設定する手法を提案した.初期値ランダムにした場合よりも分離性能が向上することから,提案法が有効であることを確認した.