素片接続型日本語テキスト音声合成における音素単位とダイフォン単位に基づく素片選択

戸田 智基  河井 恒  津崎 実  鹿野 清宏  

誌名
電子情報通信学会論文誌 D   Vol.J85-D2   No.12   pp.1760-1770
発行日: 2002/12/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
日本語テキスト音声合成,  素片選択,  母音連鎖,  ダイフォン単位,  コスト関数,  

本文: PDF(1.1MB)>>
論文を購入




あらまし: 
本論文では,日本語テキスト音声合成(TTS: Text-To-Speech)における新たな素片選択法を提案する.日本語では,母音の無声化を除くとCV(C: 子音,V: 母音)とVから音節が構成されるため,合成単位としてCV単位がよく用いられる.しかし,波形接続型のTTSにおいてCV単位を用いて音声を合成すると,VからVへの接続によりしばしば不連続感が生じる.V-V接続を防ぐためにより長い単位(CV*単位や可変長単位)がこれまでに提案されているが,V-V接続の問題はまだ解決されていない.そこで,V-V接続により生じる不連続感を低減する手法として,音素単位とダイフォン単位に基づいた新たな素片選択法を提案する.提案法では,音素境界における接続だけでなく,母音中心における接続も考慮して素片選択が行われる.評価実験結果から,提案法は音素単位に基づいた従来法と比較し,より自然性の高い音声を合成できることが明らかになった.