HMMに基づく音声合成におけるピッチ・スペクトルの話者適応

田村 正統  益子 貴史  徳田 恵一  小林 隆夫  

誌名
電子情報通信学会論文誌 D   Vol.J85-D2   No.4   pp.545-553
発行日: 2002/04/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声合成,  話者適応,  声質変換,  MLLR,  平均声,  

本文: PDF(1.1MB)>>
論文を購入




あらまし: 
本論文では,不特定話者の音声合成単位である"平均声"モデルから,任意話者の特徴をもつ音声を合成する手法を提案する.提案手法は,HMMに基づくテキスト音声合成システムに基づいている.HMMに基づく音声合成システムでは,多空間上の確率分布(MSD)に基づくHMMを用いてスペクトル及びピッチパラメータを同時にモデル化しており,HMMのパラメータを適切に変換することにより合成音声の声質や韻律特徴を変換できる.本論文では,MLLRアルゴリズムをMSD-HMMに拡張し,ピッチ及びスペクトルモデルの話者適応を行うことにより,目標話者の少量の文章を用いて,声質のみでなく韻律情報も適応できることを示す.主観評価試験により,ピッチ及びスペクトルを同時に話者適応することにより,平均声モデルを数文章で適応したモデルから,特定話者モデルからの合成音声に近い音声を合成できることを示した.