音響モデル合成を用いた単一マイクによる2話者位置推定

高島 遼一  滝口 哲也  有木 康雄  

誌名
電子情報通信学会論文誌 D   Vol.J96-D   No.3   pp.675-685
発行日: 2013/03/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (学生論文特集)
専門分野: 音声,聴覚
キーワード: 
音源位置推定,  モデル合成,  シングルチャネル,  音響伝達特性,  

本文: PDF(1.5MB)>>
論文を購入




あらまし: 
本論文では単一マイクを用いた2話者の音源位置推定手法について提案する.我々はこれまで音響伝達特性の識別に基づく,単一マイクによる音源位置推定法を提案してきたが,それは話者が一人のみであることを前提とした手法であった.そこで本論文ではこれまで提案した枠組みを元に,新たに音響モデル合成を用いることで,単一マイクで2話者の音源位置推定を行う手法を提案する.提案手法では位置ごとの観測信号の音響伝達特性をあらかじめ推定し,そのモデルを学習しておく.そして,学習された音響伝達特性モデルと各話者の音響モデルを合成させることで,複数話者のそれぞれの位置における混合音声信号のモデルを作成する.その後,二人の話者が同時に発話した評価音声について,位置の組合せごとに合成された混合信号モデルとのゆう度を比較することでそれぞれの話者の位置を推定する.2話者位置推定の実験により,特に位置ごとの学習データが少量の場合において提案手法の優位性を確認できた.