N-gramの部分的強調による定型表現への言語モデル適応手法

秋葉 友良  伊藤 克亘  藤井 敦  

誌名
電子情報通信学会論文誌 D   Vol.J86-D2   No.12   pp.1727-1736
発行日: 2003/12/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
大語彙連続音声認識,  N-gram言語モデル,  タスク適応,  質問応答,  定型表現,  

本文: PDF(1.4MB)>>
論文を購入




あらまし: 
音声入力に対応した質問応答システムのためのN-gram言語モデルを作成する手法を提案する.質問応答の入力は,検索トピックに関する前半部分と,質問文に使われる定型的な文末表現(定型表現)から構成されることが多い.新聞記事などの検索対象コーパスから作成した言語モデルでは,前半をうまくモデル化する一方,定型表現を十分にモデル化できない.本論文では,この問題を一般コーパスから作成した言語モデルを定型表現に適応する問題として扱い,収集が困難な適応コーパスを用いず,人手で作成した定型表現のリストだけを利用する言語モデル適応手法を提案する.提案手法は,定型表現リストを用いて,一般コーパスから得たN-gramの定型表現に該当する箇所を特定し,そのN-gramを強調することでモデルの適応を行う手法であり,一般コーパス自身の部分的なN-gramを事後知識とみなした最大事後確率推(MAP推定)を行うことに相当する.質問応答システムの入力となる質問文音声の認識実験を行い,本手法の有効性を確認した.