音声自由対話システムTOSBURG ―ユーザ中心のマルチモーダルインタフェースの実現に向けて―

竹林 洋一  

誌名
電子情報通信学会論文誌 D   Vol.J77-D2   No.8   pp.1417-1428
発行日: 1994/08/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 招待論文 (マルチモーダルインタフェースと要素技術論文特集)
専門分野: 
キーワード: 
音声対話,  マルチモーダル,  マルチメディア,  音声理解,  ヒューマンインタフェース,  

本文: PDF(892.2KB)>>
論文を購入




あらまし: 
ユーザ中心の音声自由対話システムTOSBURG (Task-Oriented dialogue System Based on speech Understanding and Response Generation)についてメディア技術とマルチモーダルインタフェースの観点から論じる.筆者らは,「ユーザに対して何ら制約を設けない」というコンセプトのもとで,雑音免疫ワードスポッティング,キーワードに基づく自由発話理解,ユーザ主導型対話制御,マルチモーダル応答生成,音声応答キャンセル等の要素技術を開発し,それらを統合して不特定ユーザ向きの実時間音声対話システムを開発した.また,実システム上に構築した音声対話データ収集・評価システムは,実音声データと,キーワード検出,音声理解,対話処理等の対話システムの中間処理結果とを記録でき,システム性能評価のほかに音声対話コーパスの構築やヒューマンファクタの評価改良に活用できる.不特定ユーザによる実システムの試用と評価実験の結果,ユーザからの割込み機能,マルチモーダル応答,キーワードに基づく自由発話理解が対話の自然性とロバスト性の向上に有効であることを確認した.