意見文検索のための言語モデルにおける局所文脈スムージング

岡本 和剛  本田 徹也  江口 浩二  

誌名
電子情報通信学会論文誌 D   Vol.J93-D   No.6   pp.714-723
発行日: 2010/06/01
Online ISSN: 1881-0225
Print ISSN: 1880-4535
論文種別: 特集論文 (情報爆発論文特集)
専門分野: 自然言語処理,情報検索
キーワード: 
スムージング,  言語モデル,  意見検索,  文検索,  

本文: PDF(232.3KB)
>>論文を購入


あらまし: 
近年,Webの発展と普及に伴って情報の発信が容易になり,アクセス可能な情報が爆発的に増加しつつある.このような中,ある着目する話題に対する肯定的若しくは否定的な意見を含む文を検索する機能の有用性は極めて高いといえる.本論文では,意見情報がしばしば複数の文にまたがって表現されることと,文書中の局所的な範囲において話題や意見極性が首尾一貫していることが少なくないという特性に着目し,局所文脈なる概念を導入し意見文検索に適用する.また,情報検索に用いられる従来の言語モデルのスムージング手法を拡張し,局所文脈に基づく言語モデルを用いた新たな手法を提案する.これにより,従来手法と比較して意見文の検索有効性が統計的に有意に改善することを実験によって示す.