逐次発話理解法による対話音声理解

宮崎 昇  中野 幹生  相川 清明  

誌名
電子情報通信学会論文誌 D   Vol.J87-D2   No.2   pp.456-463
発行日: 2004/02/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声理解,  逐次発話理解,  ISSS,  音声対話システム,  

本文: PDF(1.3MB)>>
論文を購入




あらまし: 
音声対話においては,複数のユーザ発話区間にわたる単語列をまとめて解釈した場合に,個々の発話区間を解釈した場合と異なる意味をもつような発話区間列が出現する.このような入力に対しては複数の発話区間にわたる単語列に対する言語処理が必要である.一方で,音声対話システムが即時性の高い応答を出力するためには,発話区間が入力されるたびにその解釈を決定することが望ましい.これらの要求を同時に満たすため,本論文では逐次発話理解法,及びその一実現法である,ISSSアルゴリズムを提案する.提案する逐次発話理解法は,各発話区間に対応する音声認識結果と,それ以前に得られている音声認識結果を連結して得られる入力単語列に対して,導出可能な音声理解候補を列挙し,音声認識と言語処理における優先度を統合した優先度を用いて,最も確からしい理解結果を決定するものである.実装にあたっては,N-best音声認識候補を用い,冗長な理解候補の列挙を回避し,更にビーム探索を導入したISSSアルゴリズムを定式化する.また,提案法を評価するために,新たに文脈を考慮した音声理解法の評価尺度を提案し,人間-機械間の対話データを収集して提案法を評価した.提案法は複数の発話区間にわたる単語列を対象としない音声理解法と比較し,統計的に有意な理解精度の向上を示した.