複素ケプストラム分析合成によるピッチ変換法

清山 信正  都木 徹  梅田 哲夫  宮坂 栄一  

誌名
電子情報通信学会論文誌 A   Vol.J75-A    No.4    pp.694-702
発行日: 1992/04/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 論文
専門分野: 音声
キーワード: 
複素ケプストラム,  分析合成方式,  ピッチ同期,  ピッチ変換,  

本文: PDF(593.1KB)>>
論文を購入



あらまし: 
音声のピッチを高品質に制御する場合,従来,残差駆動による分析合成方式が採用されてきたが,これらの方法では音源情報と声道特性の分離が不完全なため,ピッチ変更時に合成音の品質劣化を生じやすい.本論文では,このピッチ変更時の品質劣化を低減する新しい変換方式を提案する.まず有声部においてピッチ同期で切り出した音声波形から複素ケプストラムを求め,これからピッチ周期の整数倍の成分と,それ以外の成分をくし形リフタと逆くし形リフタで分離し,それぞれの時間波形を求める.分離されたピッチ情報を表すパルス列(pitch pulse)はゼロ位相化し,声道情報を表す単位応答(unit response)にはその逆の補償を施す.すると,パルス列は整形されせん鋭になり,声道情報との分離が良くなる.このパルス列のピッチパルスの位置を適応的に位相制御しながらピッチ同期で音声合成を行う.これにより大幅なピッチ変換を行っても品質劣化を少なくすることが可能である.この方式および残差駆動方式,ゼロ位相化残差駆動方式の3方式を用いて,単語音声を一様にピッチ変換したものについて心理評価実験と物理評価を行ったところ,本方式の合成品質が他の2方式に比べて優れていることが確認された.