HMMに基づく音声認識のための音節モデルとtriphoneモデルの比較

中川 聖一  花井 建豪  山本 一公  峯松 信明  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.6   pp.1412-1421
発行日: 2000/06/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  HMM,  音節,  triphone,  セグメント統計量,  

本文: PDF(338.7KB)>>
論文を購入




あらまし: 
現在,音声認識の手法として隠れマルコフモデルが広く用いられているが,基本的な構造のHMMには特徴パラメータ時系列の時間的な変化特性を十分に表現できないという欠点がある.以前,我々は,複数のフレームを結合してセグメントを構成し,それを音節HMMに入力する,セグメント単位入力HMMの有効性を示すとともに,セグメント単位入力の統計量にΔケプストラム,ΔΔケプストラムを使用すると更に性能が向上することを示した.本論文ではパワー情報の追加,混合分布,コンテクスト依存モデルを採用した場合の結果について述べる.次に世界的標準となっているtriphoneモデルと音節モデルを認識性能の観点から比較し,実験結果より音節もtriphoneと同様に日本語の音声認識において有効な単位であるということを示す.