一般化ラプラス混合分布に基づく音声認識用音響モデリング

中村 篤  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.11   pp.2118-2127
発行日: 2000/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声情報処理:現状と将来技術論文特集)
専門分野: 現状技術の基礎理論:音声認識・理解・対話
キーワード: 
音声認識,  音響モデル,  分布形状,  尖度,  一般化ラプラス分布,  

本文: PDF(150KB)>>
論文を購入




あらまし: 
音声認識用の音響モデルにおいては,ガウス分布,あるいはガウス混合分布が広く用いられている.未知の母集団をパラメトリックにモデリングする際にガウス分布を用いることの一般的優位性は,中心極限定理に代表される,ガウス分布がもつ様々な性質によって理論的には明らかであるが,一方で,音声認識のために,限られた数の学習用データサンプルを用いて,ある音響的特徴量の時系列をモデリングするという具体的な問題に対して,ガウス分布をベースとする方法が常に最適である保証はない.本論文では,ラプラス分布,ガウス分布を包含し,より広範な分布形状を表現可能な,一般化ラプラス分布をベースとする音響モデリングを提案する.一般化ラプラス分布の定式化と分布パラメータ推定法を示すとともに,ガウス混合出力分布をもつ隠れマルコフモデルの再学習によって一般化ラプラス混合出力分布をもつ音響モデルを構築し,自然発話音声を用いた連続音声認識実験によってガウス混合分布に基づく場合に比して認識性能が向上することを示した.