含意関係に基づく二部グラフを用いた情報の断片のランキング

飯塚 翔  湯本 高行  新居 学  上浦 尚武  

誌名
電子情報通信学会論文誌 D   Vol.J101-D   No.4   pp.681-689
発行日: 2018/04/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2017DEP0008
論文種別: 特集論文 (データ工学と情報マネジメント論文特集)
専門分野: 情報検索
キーワード: 
情報検索,  リンク解析,  含意認識,  NTCIR,  

本文: PDF(1.1MB)
>>論文を購入


あらまし: 
本論文では,Webページから抽出した情報の断片である,iUnitのランキング手法を提案する.この手法では,iUnitとWebページの含意関係に基づいて,二部グラフを構築し,それに対してリンク解析の手法を適用することでiUnitのランキングを行う.含意認識の手法として3種類,リンク解析の手法としては次数,PageRank,HITSを基にした3種類を提案する.NTCIR-12 MobileClick-2 iUnit Ranking Subtaskの日本語データ及び英語データを用い,最適な組合せを検討したところ,リンク解析の手法については大きな差が見られなかったが,含意関係の推定手法については言語によって適する手法が異なることがわかった.また,同タスクに提出された結果と比較を行ったところ,日本語データにおいては最も精度がよく,英語データにおいても最も精度がよい結果と同等の精度であった.