一般化ベルヌーイ試行に基づく言語確率の補正方法

小川 厚徳  武田 一哉  板倉 文忠  

誌名
電子情報通信学会論文誌 D   Vol.J81-D2   No.12   pp.2703-2711
発行日: 1998/12/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
N-gramモデル,  言語重み,  正規化,  一般化ベルヌーイ試行,  

本文: PDF(586.5KB)>>
論文を購入




あらまし: 
一般化したベルヌーイ試行に基づく言語確率の計算方法を提案する.現在,連続音声認識システムの言語モデルとしてはN-gramモデルが一般に用いられている.しかし,マルコフ性を仮定したN-gramモデルでは,単語間遷移のたびに局所的な言語制約に基づく確率値がかけられるため,言語確率は1文中の単語数が増えるに従い小さく評価される.そのため,音響確率密度に対する言語確率の重み(言語重み)を大きく設定するほど認識結果文に含まれる単語数が少なくなる傾向にあることを確認した.本論文で提案する計算方法は,通常のN-gram言語確率に加え,認識対象文に含まれる総単語数と各単語の出現頻度を考慮する.連続音声認識実験により,提案モデルと通常のN-gramモデル,N-gramモデルによる対数言語確率を単語数で割り正規化する方法との比較検討を行った.その結果,提案法では,単語正解率,単語正解精度ともに改善が得られた.更に,提案法では,言語重みに依存せずに正解に近い単語数からなる認識結果文を得ることができた.以上の結果より,連続音声認識システムの認識率改善においては,言語確率の計算において,文中の単語数を考慮することが有効であることを確認できた.