状態クラスタリングによるHM-Netの構造決定法の検討

堀 貴明  加藤 正治  伊藤 彰則  好田 正紀  

誌名
電子情報通信学会論文誌 D   Vol.J81-D2   No.10   pp.2239-2248
発行日: 1998/10/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  隠れマルコフモデル,  音素環境依存モデル,  隠れマルコフ網,  状態クラスタリング,  大語い連続音声認識,  

本文: PDF(721.3KB)>>
論文を購入




あらまし: 
隠れマルコフ網(HM-Net)は,音素環境依存HMMの状態共有関係をネットワークとして表現する手法であり,高精度かつ頑健な音声認識を実現する音響モデルとして有効であることが示されている.HM-Netを生成する方法として,これまで逐次状態分割法(Successive State Splitting: SSS)やその改良が提案されているが,これらの手法は学習サンプルを用いて状態分割とパラメータ推定を繰り返す手法であるため,不特定話者の大量の学習データ(数千~数万文)を利用する場合には計算量が膨大になるという問題がある.通常,HM-Netは特定話者のデータ(数百文または数千単語)によって構造成決定され,各状態の分布のみが不特定話者の大量データによって再推定される.しかし,構成決定に用いる学習データが特定話者の限られたデータであると,大語い連続音声認識などに用いる大規模なHM-Netの構造が得られない.本論文では大語い連続音声認識のための高精度なHM-Netを作成する手法として,状態クラスタリングに基づく高速なHM-Netの構造決定法を提案した.同じ学習サンプルセットを用いた場合に,本手法が従来と同等以上のHM-Netを高速に生成可能であることが音素認識実験により示された.