クロスリンガル音声合成のための共有決定木コンテクストクラスタリングを用いた話者適応

長濱 大樹  能勢 隆  郡山 知樹  小林 隆夫  

誌名
電子情報通信学会論文誌 D   Vol.J100-D   No.3   pp.385-393
発行日: 2017/03/01
Online ISSN: 1881-0225
論文種別: 特集論文 (学生論文特集)
専門分野: 音声,聴覚
キーワード: 
HMM音声合成,  話者適応,  共有決定木コンテクストクラスタリング,  クロスリンガル音声合成,  話者適応学習,  

本文: PDF(742KB)
>>論文を購入


あらまし: 
本論文では,隠れマルコフモデル(HMM)に基づくクロスリンガル話者適応を用いた音声合成において新たな手法を提案し,従来手法との比較評価を通して提案手法の有効性の検討を行っている.HMMに基づくクロスリンガル話者適応では,入力言語の平均声モデルと目標話者の適応データ間で求めた変換行列を出力言語の平均声モデルに適用するために二つの言語の平均声モデル間に対応付けを行う必要がある.これまでに提案されている状態マッピングを用いた手法では,二つの平均声モデルのリーフノードの分布パラメータの類似度を用いて対応付けを行っており,対応関係にコンテクストを反映することができず話者適応の性能が低下していた.そこで,本論文では二つの言語の平均声モデルの一部で決定木を共有することで,音韻・韻律に関するコンテクスト情報を考慮して状態の対応付けを行う手法を提案する.従来手法と提案手法を用いて客観及び主観評価実験を行い,提案手法が従来手法に比べ話者類似性を維持したまま自然性が高い音声を合成できることを示す.