コミュニティを考慮したカーネル引用解析

伊藤 敬彦  新保 仁  持橋 大地  松本 裕治  

誌名
電子情報通信学会論文誌 D   Vol.J90-D   No.2   pp.233-244
発行日: 2007/02/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (データ工学論文特集)
専門分野: 情報検索
キーワード: 
HITS,  グラフカーネル,  pLSI,  リンク解析,  

本文: PDF(570KB)>>
論文を購入




あらまし: 
本論文ではKandolaらのノイマンカーネルを複数のコミュニティが存在する引用関係グラフに適用する際に生ずる問題点について議論する.ノイマンカーネルはパラメータ調整によって,個々の論文に対して,関連論文あるいは重要論文をランク付けして提示できる. しかし,パラメータを重要度に偏らせると 引用グラフ全体における支配的なコミュニティの重要論文のみが,個々の論文が属するコミュニティにかかわらず,上位にランキングされてしまう.これに対して我々は,引用の生成過程をHofmannのpLSI(probabilistic Latent Semantic Indexing)によりモデル化し,その結果を用いて,コミュニティごとの重み付き引用グラフ(コミュニティグラフ)を計算する. これらのグラフは,引用の各コミュニティに対する帰属確率を計算し,弧の重みとするため,同一の引用が,複数のコミュニティグラフに異なった重みのもとで存在することができる(多重コミュニティ).得られたコミュニティグラフにノイマンカーネルを適用することによって,対象論文が属するコミュニティを考慮して重要論文を推薦,提示できる.