STRAIGHT混合励振源を用いた混合正規分布モデルに基づく最ゆう声質変換法

大谷 大和  戸田 智基  猿渡 洋  鹿野 清宏  

誌名
電子情報通信学会論文誌 D   Vol.J91-D   No.4   pp.1082-1091
発行日: 2008/04/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声合成,  声質変換,  混合正規分布モデル,  STRAIGHT,  混合励振源,  

本文: PDF(875.2KB)>>
論文を購入




あらまし: 
声質変換において,スペクトル特徴量系列の統計的モデル化技術の発展により,その変換性能は大幅に改善された.しかし,声質変換で用いられる音源モデルでは実際の音源を正確に表現できていないため,その変換音声の自然性は十分なものとはいいがたい.これを改善するために,スペクトル特徴量系列と同様に音源特徴量系列に対しても統計的なモデリングを行う必要がある.本論文では混合正規分布モデル(Gaussian Mixture Model:GMM)に基づく声質変換法の枠組みに対してSTRAIGHT混合励振源を導入する.提案法では,スペクトル特徴量系列及び音源特徴量系列に対して最ゆう推定(Maximum likelihood estimation:MLE)に基づく特徴量変換が行われる.客観評価実験並びに主観評価実験の結果より,提案法により音質,話者性変換精度が大きく改善されることを示す.