隠れマルコフ網で表現した音素コンテキスト依存モデルのための話者適応

鷹見 淳一  嵯峨山 茂樹  

誌名
電子情報通信学会論文誌 D   Vol.J77-D2   No.12   pp.2325-2333
発行日: 1994/12/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 
音声認識,  話者適応,  音素コンテキスト依存HMM,  隠れマルコフ網,  移動ベクトル場平滑化法,  標準話者予備選択,  

本文: PDF(664.3KB)>>
論文を購入




あらまし: 
教師あり話者適応に基づく実用的な不特定話者音声認識システムの構築に向けた,少量の適応用サンプルによる高精度な話者適応手法について述べる.適応に使用できる音声サンプルが少量である場合,一度に多くのモデルパラメータを変更するだけの情報量が得られず,またサンプルの統計的な偏りによる推定誤差も生じてしまうという点が問題となる.そこで,音素コンテキストに独立な混合連続分布型音素HMMに比べて少ないモデルパラメータで,それと同等以上の認識性能を発揮することのできる,隠れマルコフ網(HMnet)を用いた話者適応法を提案する.適応手法としては,少量サンプルに起因する未適応モデルパラメータの補間や話者適応時の推定誤差の補正が同時に実現できる移動ベクトル場平滑化法(VFS)を使用する.更に,話者適応精度を向上させるための標準話者選択法についても検討する.