周波数軸伸縮を用いた混合正規分布モデルに基づく声質変換法

戸田 智基  陸 金林  猿渡 洋  鹿野 清宏  

誌名
電子情報通信学会論文誌 D   Vol.J84-D2   No.10   pp.2181-2189
発行日: 2001/10/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
声質変換,  STRAIGHT,  混合正規分布モデル,  周波数軸伸縮,  差分スペクトルの重み,  

本文: PDF(617.4KB)>>
論文を購入




あらまし: 
声質変換の従来法として,Stylianouらによって混合正規分布モデルに基づく声質変換法が提案されている.高品質な分析合成方式STRAIGHTに適用させることにより構築した混合正規分布モデルに基づく声質変換システムは,不連続感の少ない変換音声を得ることができる.しかし,変換スペクトルを求める際に期待値操作を行うことによりスペクトルが過剰に平滑化されるので,音質が劣化してしまうという問題点がある.そこで本論文では,音質の劣化を防ぐ手法として,スペクトルの周波数軸伸縮を用いた混合正規分布モデルに基づく声質変換法を提案する.評価実験を行った結果,提案法である周波数軸伸縮を用いたGMMに基づく変換法は,GMMに基づく変換法と比較しより良い音質をもちかつ同程度の話者性をもつ変換音声を合成できることがわかった.また,周波数軸伸縮のみでは話者性変換精度がわずかに低下するが,重み付けされた差分スペクトルを加える操作を行うことによりその低下を抑えることができることがわかった.