音声認識における自律的なモデル複雑度制御を用いた話者適応化

篠田 浩一  渡辺 隆夫  

誌名
電子情報通信学会論文誌 D   Vol.J79-D2   No.12   pp.2054-2061
発行日: 1996/12/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声言語によるコミュニケーションシステムの実現に向けて(音声認識,合成,対話処理,システム構築の諸問題)論文特集)
専門分野: 音声認識用音響モデル,話者・環境適応
キーワード: 
話者適応化,  不特定話者認識,  連続分布HMM,  モデル複雑度,  MDL基準,  

本文: PDF(528.5KB)>>
論文を購入




あらまし: 
連続分布HMMを用いる音声認識における話者適応化法を提案する.本手法は混合ガウス分布の各要素分布の平均ベクトルの適応前後の差分ベクトル(適応化ベクトル)を推定する.適応化ベクトルを複数のガウス成分間で共有し,その共有の度合(共有度)をモデルの複雑さとみなし,データ量に応じてその制御を行うことで,適応化に用いるデータ量の多少にかかわらず高い性能を示すことを特徴とする.本手法においては,まず,共有度の異なる多くの適応化ベクトルの集合(モデル)が準備され,次に,適応化用に与えられたデータに対し最適な共有度をもつモデルが選択される.モデル選択の基準としてデータ量しきい値を用いる方法と情報量基準の一つであるMDL基準を用いる方法を比較・検討した.5000単語認識実験により評価を行い,適応化用音声が50単語のとき,エラーの削減率が40%と,良好な結果を得た.