大規模コーパスを用いた音声合成システムXIMERA

河井 恒  戸田 智基  山岸 順一  平井 俊男  倪 晋富  西澤 信行  津崎 実  徳田 恵一  

誌名
電子情報通信学会論文誌 D   Vol.J89-D   No.12   pp.2688-2698
発行日: 2006/12/01
Online ISSN: 1881-0225
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
テキスト音声合成システム,  コーパスベース方式,  大規模コーパス,  HMMを用いた韻律生成,  知覚実験,  

本文: PDF(462.5KB)
>>論文を購入


あらまし: 
本論文では,ATR音声言語コミュニケーション研究所が開発した新しい音声合成システムXIMERAについて述べる.XIMERAは,これまでATRで開発された音声合成システム ι-Talk及びCHATRと同様,コーパスベース方式を採用している.XIMERAの特長は,(1)大規模な音声コーパス(日本語男声110時間,日本語女声59時間,中国語女声20時間,それぞれ単一話者),(2) HMMを用いた韻律パラメータのモデル化及び生成,(3)知覚実験に基づく素片選択コスト関数の最適化,である.XIMERAの性能を評価するため,市販の音声合成システム10製品と合成音声の自然性を比較したところ,XIMERAが他のシステムより優れていることが示された.