音素群対確率比空間における音素認識

小林 哲則  浜野 康和  安 成雨  白井 克彦  

誌名
電子情報通信学会論文誌 A   Vol.J77-A   No.2   pp.128-134
発行日: 1994/02/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 特集論文 (不特定話者音声認識論文特集)
専門分野: 話者適応
キーワード: 
音声認識,  HMM,  話者適応,  

本文: PDF(481.6KB)>>
論文を購入




あらまし: 
音素群対確率比空間なる新たな音声認識用の特徴パラメータ空間を提案し,話者適応型の音声認識に応用した.ここで提案した座標空間では,音声認識上区別する必要のない空間は1点に圧縮される.スペクトル空間から提案する空間への座標交換関数はニューラルネットワークを用いて実現した.この空間上では,従来の空間に比べ認識の観点からより効率的なコードベクトルを求めることができる.更に,座標系の定義により,本座標系は各音素の相対位置関係を表すため,従来の方法に比べ容易に話者適応を行うことが可能である.実験では,母音および/b/,/d/,/g/,/m/,/n/を認識対象として,スペクトル空間でHMMを用いた場合と,提案した空間でHMMを用いた場合を比較した.話者特定の実験では座標変換によって母音で約38%子音で約20%のエラーが改善された.また,座標変換を個人ごとに行えば,HMMの学習を個人ごとに行わなくても,スペクトル空間で個人ごとにHMMの学習を行った場合より高い性能を得られることがわかった.