認識誤り傾向の確率モデルを用いた2段階探索法による大語彙連続音声認識

阿部 芳春  伍井 啓恭  丸田 裕三  中島 邦男  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.12   pp.2545-2553
発行日: 2000/12/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
大語彙連続音声認識,  多段階探索,  統計的誤り訂正モデル,  最良優先探索,  統計的言語モデル,  

本文: PDF(391KB)>>
論文を購入




あらまし: 
多段階探索による大語彙連続音声認識の1方法を提案する.提案法は2段階で構成される.第1段階は音響モデルに基づいて入力音声から基本単位の最ゆう系列を復号する.第2段階は第1段階の復号出力において単語の最ゆう系列を探索し,認識結果とする.新奇な点は探索の第2段階で用いる差分モデルである.差分モデルは統計モデルとして実現され,学習データの基本単位認識結果からパラメータが推定される.差分モデルによって第1段階で生ずる復元誤りに対処して,正解単語列を探索することが可能となる.第1段階はトライホンモデルを用いた1パスDPアルゴリズムで実現される.第2段階は差分モデルとNグラム言語モデルを用いた最良優先探索アルゴリズムで実現される.提案法を新聞記事の読上げ音声を用いて評価した.その結果,音節を基本単位としたNベスト音節列と語彙数約6万5千のトライグラム言語モデルを用いたとき,テストセットパープレキシティ123,未知語率0.5%の評価データに対して単語誤り率6.7%(文字単位の誤り率4.8%)が得られた.