非同期遷移型HMMによる音声認識

松田 繁樹  中井 満  下平 博  嵯峨山 茂樹  

誌名
電子情報通信学会論文誌 D   Vol.J86-D2   No.6   pp.741-754
発行日: 2003/06/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  HMM,  非同期遷移型HMM,  時間方向共有法,  自動構造決定,  

本文: PDF(2.1MB)>>
論文を購入




あらまし: 
音響特徴ベクトル時系列における個々の特徴量間の時間非同期遷移構造に着目した非同期遷移型HMM (Asynchronous Transition Hidden Markov Model: AT-HMM)を提案する.従来のHMMは音声特徴量を多次元ベクトル分布をもつ状態の連鎖により表現しているため,ベクトルを構成しているすべての特徴量の値が状態遷移に同期して変化することを仮定したモデルとなっている.しかし,一般に音声認識において用いられる音響特徴パラメータの個々の特徴量は必ずしも同期して変化していない.例えばケプストラム特徴量とその時間微分特徴量は原理的に同期して変化しない.お互いに同期して変化する特徴量は同時に状態遷移し,同期しない特徴量は別々に状態遷移するモデルを用いることにより,より効果的に音響特徴ベクトル時系列を表現することができると考えられる.本論文では,種々の時間非同期遷移構造を考察し,特に個々の特徴量の状態遷移に順序関係のあるAT-HMMについて,特定及び不特定話者連続音素認識の評価実験を行った.特定話者の結果,AT-HMMは従来型HMMと比較して10%から40%程度の誤り削減率が得られた.ただし,不特定話者に対しては,従来型HMMと同程度の音素認識率となった.