Wikipediaに基づくWeb閲覧履歴からの潜在的興味キーワード抽出

近藤 光正  中辻 真  田中 明通  

誌名
電子情報通信学会論文誌 D   Vol.J96-D   No.5   pp.1199-1211
発行日: 2013/05/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (データ工学と情報マネジメント論文特集)
専門分野: データマイニング
キーワード: 
情報推薦,  Web閲覧履歴,  キーワード抽出,  

本文: PDF(1MB)
>>論文を購入


あらまし: 
本論文では,ユーザのWeb閲覧履歴からユーザが普段から意識している既知の興味だけでなく,ユーザが今まで明示的には意識をしていなかった潜在的な興味の発見に導くキーワードを抽出する手法を提案する.本手法により,ユーザは検索クエリを入力することなく,自分の興味分野における潜在的な興味情報の発見が可能になる.提案手法では,ブラウザアドオンを用いてユーザのWeb閲覧履歴を取得し,取得した閲覧履歴からユーザの興味対象となるキーワードを抽出する.特にユーザの潜在的な興味情報の発見につながる潜在的興味キーワードを抽出するため,閲覧文書上の出現頻度に基づく従来のキーワード抽出手法に加え,(1)Wikipediaのエントリ構造の解析に基づくWikipedia上で重要とされるキーワードの抽出手法と,(2)検索エンジン上で多数のユーザから検索されるキーワードの抽出手法を提案する.評価実験の結果,提案手法では普段から興味対象と意識しているキーワードだけでなく,普段は検索するまでには至らない潜在的な興味の発見に導くキーワードを抽出でき,ユーザにそのキーワードを用いて情報検索を促すことで,自身の潜在的な興味情報が発見できることが確認された.