時間領域平滑化群遅延による位相制御を用いた声質制御方式

坂野 秀樹  陸 金林  中村 哲  鹿野 清宏  河原 英紀  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.11   pp.2276-2282
発行日: 2000/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声情報処理:現状と将来技術論文特集)
専門分野: 現状技術の応用:音声・音響情報処理
キーワード: 
声質制御,  ピッチ変換,  PSOLA法,  位相制御,  群遅延,  

本文: PDF(240.7KB)>>
論文を購入




あらまし: 
音声の位相情報を群遅延に基づいて表現することにより,位相特性の制御を可能とする声質制御方式を提案する.提案方式は,位相特性を群遅延領域で制御するため,原音声の位相から零位相まで連続的に変化させることができる.また,音声の特徴に基づき部分的に零位相化を行っているため,PSOLA法などの手法で見られる,ピッチ変換率を大きくしたときの劣化を軽減させることができる.ピッチ変換音声を作成して主観評価実験を行った結果,ピッチ変換率が1倍の場合に,零位相合成,PSOLA法,提案法のMOS値が,男声の場合はそれぞれ3.6,4.3,4.3,女声の場合はそれぞれ,3.8,4.2,4.3であった.ピッチ変換率が3倍の場合には,それぞれの方式のMOS値が,男声の場合に2.8,2.4,2.7,女声の場合に1.6,1.4,1.7となった.これらの結果から,提案方式は,ピッチ変換率が小さい場合には,PSOLA法に匹敵する高品質な音声が合成でき,ピッチ変換率を大きくした場合には,PSOLA法特有の劣化を減少させることができることがわかった.また,本論文では,ピッチ変換を行った際にどのように位相特性を変化させるのが適当であるかについても検討し,ピッチを上昇させた際に位相特性を零位相に近づけると,劣化が若干抑えられることがわかった.