不特定話者音声認識のための予測子コードブックの構成法

川端 豪  

誌名
電子情報通信学会論文誌 D   Vol.J75-D2   No.11   pp.1770-1777
発行日: 1992/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 
音声認識,  不特定話者,  予測子コードブック,  HMM,  

本文: PDF(531.8KB)>>
論文を購入




あらまし: 
音声の動的特徴をスペクトル予測子で表現し,予測子を要素とするコードブックを構成することによって,音声の動的特徴の多様性を取り扱う手法について述べる.また,その不特定話者音声認識における有効性を検討する.予測子の構造として,今回は,前向き予測,後向き予測,内挿型の3種について検討を行う.予測子コードブックは,LBGアルゴリズムに若干の修整を加えた予測子量子化手続きによって作成する.音韻認識レベルの評価として2種の統計的評価量と音韻認識率で検討を行った.この結果,予測子コードブックは高い音韻分離能力と話者変動に対する耐性を両立させることが判明した.更に,実際に文節認識システム中に組み込むことにより,連続音声認識レベルでの性能評価を行った.いずれの場合も,後向き予測子を要素とするコードブックが最高の性能を示した.