HITSアルゴリズムに基づく階層性を考慮したウェブコミュニティの抽出

大塚 浩司  大町 真一郎  阿曽 弘具  

誌名
電子情報通信学会論文誌 D   Vol.J90-D   No.12   pp.3161-3169
発行日: 2007/12/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: データマイニング
キーワード: 
ウェブコミュニティ,  ウェブグラフ,  ウェブ構造マイニング,  HITSアルゴリズム,  

本文: PDF(652.8KB)>>
論文を購入




あらまし: 
共通のトピックに関するウェブページの集合はウェブコミュニティと呼ばれ,ウェブコミュニティを発見するための様々な手法が提案されている.HITS (Hyperlink-Induced Topic Search)アルゴリズムは数学的に扱いやすいこと,ウェブページにオーソリティやハブという意味付けができること等から,それに基づく様々なウェブコミュニティ抽出手法が提案されている.しかし,これらの手法は2階層のウェブコミュニティを想定しており,3階層以上のウェブコミュニティの抽出は困難である.本論文では,HITSアルゴリズムの考え方に基づいた,階層性を考慮したウェブコミュニティの抽出法を提案する.中間ノードの概念を導入し,中間ノードを含めたウェブコミュニティ抽出アルゴリズムを与える.実験を行い,HITSアルゴリズムを用いた典型的な手法では抽出できないウェブコミュニティが提案手法によって抽出できることを確認する.