フレーズベース統計的機械翻訳との統合に基づく言語横断質問応答

有賀 美明  秋葉 友良  

誌名
電子情報通信学会論文誌 D   Vol.J96-D   No.3   pp.713-722
発行日: 2013/03/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (学生論文特集)
専門分野: 自然言語処理
キーワード: 
言語横断質問応答,  統計的機械翻訳,  翻訳モデル,  確率的言語モデル,  パッセージ検索,  

本文: PDF(540.8KB)>>
論文を購入




あらまし: 
質問応答は,自然言語の質問文を入力として,組織化されていない検索対象文書から質問文に対する回答を過不足なく抽出する,精度を重視した情報検索技術である.言語横断質問応答とは,質問文と検索対象文書の間で言語が異なる場合の質問応答であり,言語の違いに対処するための翻訳が重要な要素となる.一般的な手法として,機械翻訳により質問文と検索対象文書の言語を統一することで単一言語質問応答に帰着させる手法が用いられたが,この手法では翻訳誤りを質問応答が引き継いでしまうため,翻訳の品質に性能が大きく左右される問題がある.この問題に対処するため,機械翻訳を質問応答に直接統合した言語横断質問応答が提案されている.先行研究では,機械翻訳に単語ベース統計的機械翻訳を用いているが,統計的機械翻訳の分野ではフレーズベースの手法が有効であることが知られている.そこで本論文では,フレーズベース統計的機械翻訳を統合した言語横断質問応答を提案する.確率的言語モデルに基づいたパッセージ検索モデルを言語横断質問応答に適用し,フレーズに基づく翻訳モデルの統合を試みた.評価の結果,提案法は単語ベース統計的機械翻訳を用いた従来法を上回る性能を示した.