音韻性を抑えた話者空間への射影による話者認識

西田 昌史  有木 康雄  

誌名
電子情報通信学会論文誌 D   Vol.J85-D2   No.4   pp.554-562
発行日: 2002/04/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
話者認識,  部分空間法,  GMM,  話者空間,  音韻空間,  

本文: PDF(272.6KB)>>
論文を購入




あらまし: 
話者認識における問題点の一つとして,発話内容や発声時期の違い等による音声の特徴変動が挙げられる.この音声の特徴変動に対して,音声中に含まれている音韻性と話者性を分離し,話者性のみを抽出することができれば,頑健な話者認識が可能となると考えられる.そこで,本研究では,話者内分散の大きい空間を音韻空間,話者内分散の小さい空間を話者空間とみなして,主成分分析に基づく部分空間法により音韻性と話者性を線形分離する手法を提案する.本手法は,話者空間に学習データを射影し,各話者の話者空間でGMMにより話者モデルを学習することにより,話者識別及び話者照合を行う.観測空間あるいは判別分析で空間変換した部分空間で,GMMにより話者識別及び話者照合を行う方法と比較実験を行った.その結果,提案手法は従来法に比べて,少量のパラメータ数でより頑健な話者モデルを構築できることがわかった.