ドメインとスタイルを考慮したWebテキストの選択による 音声対話システム用言語モデルの構築

翠 輝久  河原 達也  

誌名
電子情報通信学会論文誌 D   Vol.J90-D   No.11   pp.3024-3032
発行日: 2007/11/01
Online ISSN: 1881-0225
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  言語モデル,  音声対話システム,  Webテキスト選択,  

本文: PDF(351.7KB)
>>論文を購入


あらまし: 
音声対話システムにおいて,ユーザの多様な発話を頑健に認識するためには,タスクドメインに合致した十分な量のテキストデータでN-gram言語モデルを構築することが望ましい.しかし,新たに音声対話システムを作成する際に,ユーザが入力すると想定される発話を大量に用意することは困難である.そこで本論文では,Webから学習データを収集・選択することにより効率的に言語モデルを構築する手法を提案する.Webの検索クエリは,対話システムが対象とするドメインについて記述された文書から作成する.これにより検索・収集されたWebテキストの多くは,対話システムのユーザの発話スタイルとマッチしたものではなく,言語モデルの学習データとしてこれらのすべてを使用するのは適切でない.そこで,別の対話システムで収集されたユーザ発話コーパスを併用することで,発話スタイルの近い文を選択する.ソフトウェアサポートと観光案内の二つのドメインにおいて評価を行った結果,パープレキティ及び音声認識精度の有意な改善が得られた.また実験結果の分析により,Webテキストを選択する際に,文のスタイルを考慮することの重要性が確認された.