木構造話者クラスタリングを用いた話者適応

小坂 哲夫  松永 昭一  嵯峨山 茂樹  

誌名
電子情報通信学会論文誌 D   Vol.J78-D2   No.1   pp.1-9
発行日: 1995/01/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 
音声認識,  話者適応,  話者クラスタリング,  Hidden Markov Network,  

本文: PDF(675.9KB)>>
論文を購入




あらまし: 
本論文では木構造話者クラスタリングアルゴリズムを用いた高速な話者適応法について述べる.クラスタリング木を上位レベルから下位レベルへとたどることにより,話者の大局的特徴から局所的特徴へと話者適応を行うことが可能となる.ここでは木構造を,入力音声に対するモデルのゆう度を基準として探索し,ゆう度が最大となるノードにおけるモデルを選択することにより,適応を行う.この話者適応法ではパラメータの修正を行わずに,クラスタリング木の枝の選択のみを行うので,少数のサンプルで適応が行える.音素モデルセットとして,ここでは音素環境を効果的に表現した隠れマルコフ網(HMnet)を用いた.実際に170人から作成された隠れマルコフ網のクラスタリングを行い木構造を作成し,日本語音素認識および,文節音声認識により評価を行った.その結果3~5秒程度のごく少数の適応サンプルで話者適応の効果が得られ,本手法が有効であることが確かめられた.