大語い連続音声認識のための単語仮説数削減

清水 徹  山本 博史  政瀧 浩和  松永 昭一  匂坂 芳典  

誌名
電子情報通信学会論文誌 D   Vol.J79-D2   No.12   pp.2117-2124
発行日: 1996/12/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声言語によるコミュニケーションシステムの実現に向けて(音声認識,合成,対話処理,システム構築の諸問題)論文特集)
専門分野: 音声認識の高速化,大語い化
キーワード: 
連続音声認識,  探索手法,  単語グラフ,  統計的言語モデル,  自然発話,  

本文: PDF(620.8KB)>>
論文を購入




あらまし: 
本論文では,大語い連続音声認識を目的とした,単語グラフを用いる連続音声認識手法を提案する.本認識手法では,計算量削減手法として,(1)同音語の言語ゆう度の共有化,(2)開始時刻の代表化処理における先行単語の共有化,(3)木構造辞書ノード間の言語ゆう度の補間の三つの手法を導入した.本手法の効果を,“ATR Travel Arrangement Corpus”を用いて評価した.その結果,同音語の言語ゆう度の共有化は大きな計算量削減効果があること,単語の先頭の異音が同じであれば単語の開始時刻を一つに絞っても問題ないこと,言語ゆう度の変化を分散させることにより探索に要するビーム幅を小さくできることがわかった.これらの計算量削減手法により処理時間の99%が削減され,汎用ワークステーション(135SPECint92)での語い数6,635語の準実時間認識を可能にした.