マルチチャネル非負値行列因子分解における階層的クラスタ分析を用いた音源分離性能の向上

浦本 昂伸  上ノ原 進吾  古家 賢一  
(学生論文特集秀逸論文)

誌名
電子情報通信学会論文誌 D   Vol.J102-D   No.3   pp.118-129
発行日: 2019/03/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2018PDP0007
論文種別: 特集論文 (学生論文特集)
専門分野: 音声,聴覚
キーワード: 
音源分離,  雑音除去,  非負値行列因子分解(NMF),  マルチチャネルNMF,  階層的クラスタ分析,  

本文: FreePDF(1.7MB)


あらまし: 
非負値行列因子分解(Nonnegative Matrix Factorization: NMF)とは,非負値の行列を二つの非負値行列に因子分解する手法である.音響分野では,NMFをマルチチャネル拡張することで空間情報を活用し,高精度に音源分離を行う手法であるマルチチャネルNMF (Multichannel NMF: MNMF)が提案されている.しかし,MNMFは自由度の高いモデルであるため局所最適解に陥りやすく,分離性能の初期値依存性が課題となっている.先行研究として,2チャネルを用いた研究が盛んに行われているが,本論文では,3チャネル以上にチャネル数を増やした場合を検討する.音源の分離実験より,ランダムな初期値を設定した場合には,チャネル数を増加させても,分離性能が向上しないことが確認された.そこで,ランダム初期値を設定した従来法の分離結果として得られる空間相関行列を用い,分離信号に対して階層的クラスタ分析を行う.分析結果として得られたクラスタの中で同じものに属する信号同士をアンサンブル平均することで,新たな信号を算出する手法を提案した.ランダム初期値の場合よりも分離性能が向上することから,提案法の有効性を確認した.