Nベスト意味探索と再評価法を用いた大規模内線受付装置の試作

黒岩 眞吾  内藤 正樹  武田 一哉  谷戸 文廣  山本 誠一  

誌名
電子情報通信学会論文誌 D   Vol.J79-D2   No.12   pp.2132-2138
発行日: 1996/12/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声言語によるコミュニケーションシステムの実現に向けて(音声認識,合成,対話処理,システム構築の諸問題)論文特集)
専門分野: 音声認識の高速化,大語い化
キーワード: 
連続音声認識,  Nベスト探索,  多段認識アルゴリズム,  電話,  音声応用システム,  

本文: PDF(549.5KB)>>
論文を購入




あらまし: 
5000人規模の組織の内線電話受付業務を実時間で行うことが可能な大規模内線受付装置を試作した.本装置では粗いモデルである音素環境非依存のHMMによる探索の結果得られる複数(N-BEST)候補を,より詳細なモデルである音素環境依存のHMMで再評価することで高速・高性能な連続音声認識を実現している.1段目の粗いモデルでの探索では少ない候補数で正解が得られるように,意味内容が同一となるものを探索時にマージするN-BEST意味探索手法を用いた.同手法では終端記号から書き換えられるすべての非終端記号が意味的なカテゴリーに対応するように作成した文法を用い,非終端記号のN-BEST系列を探索することで同一意味候補のマージを実現している.同手法を用いることで,先に筆者らが試作した200人規模の内線受付装置で収集した実環境音声データに対し,音声入力時間の10分の1(0.3秒)程度の再評価時間で誤り率を3分の1にすることが確認された.装置はDSPとRISC-CPUのマルチプロセッサ構成を採用している.1623人の組織でのフィールドテスト行った結果,実環境において1位で87%,3位までで90%の認識性能が得られた.