韻律情報を用いたスペクトル変換方式の検討

望月 亮  大久保 雅史  小林 哲則  

誌名
電子情報通信学会論文誌 D   Vol.J88-D2   No.11   pp.2269-2276
発行日: 2005/11/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
話者変換,  GMM,  韻律情報,  ケプストラム,  音声合成,  

本文: PDF(760.3KB)>>
論文を購入




あらまし: 
GMMを用いたスペクトル変換方式による話者変換において,韻律に関する情報を特徴量に加え,変換精度を改善する方法について提案する.従来のGMMを用いたスペクトル変換では純粋にスペクトルパラメータのみが入力情報として使用されていた.しかし,一般的に音声のスペクトルは発話時の基本周波数などと密接に関係しているため,変換の際に韻律情報を考慮することで,変換音声の品質向上が期待できる.そこで実際の規則合成に応用することを想定し,変換元と変換先の韻律情報を利用してGMMを学習し,精度の良いスペクトル変換を行う方法について提案する.また,提案するスペクトル変換方式を音声合成の枠組みの上で話者変換に応用する.このとき,パラレルコーパスを用いてより多くの韻律条件において学習データを確保するため,トライフォン単位で結合ベクトルを作成する方法について検討する.ケプストラム距離を用いた物理評価により,韻律情報を用いることがスペクトル変換精度の向上に有効であることを示す.また,従来方法と提案方法で変換した音声の音質,及び話者性について試聴評価を行い,聴感的にも提案方法が有効であることを示す.