N-best音声認識における認識スコアを利用した候補提示数の決定

趙 國  宮山 章子  山下 洋一  

誌名
電子情報通信学会論文誌 D   Vol.J88-D2   No.6   pp.1003-1011
発行日: 2005/06/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  N-best,  認識スコア,  ヒューリスティクス,  

本文: PDF(1.3MB)>>
論文を購入




あらまし: 
近年,統計的手法の利用によって音声認識技術が大きく向上したものの,認識結果を一つだけ提示する場合,正しい結果が常に得られるとは限らないのが現状である.そのため,認識結果を複数候補提示し,利用者が候補の中から正解を選択する音声インタフェースの研究が行われている.このようなN-best方式の音声認識に基づく音声インタフェースでは,提示する候補数の決定が重要な問題となる.認識候補を多く表示すれば正解が含まれる確率は高くなるが,ユーザが正解を探す手間も増える.そこで,N-best候補の認識スコアの分布を利用して候補提示数を動的に決定する手法を提案する.N-best候補における認識スコアと候補間の認識スコアの差を利用して候補提示数を決定すれば,正解が含まれる確率(正解提示率)をあまり下げることなく,提示する候補数を大幅に減らせることを示す.