音素決定木に基づく逐次状態分割法によるHM-Netの検討

堀 貴明  加藤 正治  伊藤 彰則  好田 正紀  

誌名
電子情報通信学会論文誌 D   Vol.J80-D2   No.10   pp.2645-2654
発行日: 1997/10/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  隠れマルコフモデル,  コンテクスト依存モデル,  隠れマルコフ網,  音素決定木,  

本文: PDF(640.8KB)>>
論文を購入




あらまし: 
限られた学習サンプルを用いて高精度かつ頑健なコンテクスト依存モデルを生成するために重要なことは,パラメータの共有関係をどのように決定するか,未知コンテクストをどのように扱うかである.鷹見らによって提案された逐次状態分割法(SSS)[4]は,ゆう度最大化を基準にモデルの状態共有関係を自動的に決定する優れた手法であるが,未知コンテクストの扱いが十分ではなく,状態分割時の分布の分割法にも問題がある.本論文では,逐次状態分割法のコンテクスト方向の状態分割過程に,音素決定木に基づくコンテクストクラスの分割法を導入し,同時に分布の分割法も改良したDT-SSSアルゴリズム(Decision Tree-based Successive State Splitting)を提案する.この手法により,高精度かつあらゆるコンテクストを表現可能なHM-Netの自動生成が可能となる.特定話者/不特定話者連続音素認識実験より,従来のSSSによるHM-Netと同等以上の音素正解率が得られた.特に未知コンテクストを含む音声における誤りの削減が大きく,本手法の有効性が示された.