|
本文PDFファイルを閲覧するには,ログインする必要があります.
左メニューよりログインして下さい.
|
HITSアルゴリズムに基づく階層性を考慮したウェブコミュニティの抽出
大塚 浩司 大町 真一郎 阿曽 弘具
誌名
電子情報通信学会論文誌 D
Vol.J90-D
No.12
pp.3161-3169 発行日: 2007/12/01 Online ISSN: 1881-0225
DOI: Print ISSN: 1880-4535 論文種別: 論文 専門分野: データマイニング キーワード: ウェブコミュニティ, ウェブグラフ, ウェブ構造マイニング, HITSアルゴリズム,
本文: PDF(652.8KB)>>
あらまし:
共通のトピックに関するウェブページの集合はウェブコミュニティと呼ばれ,ウェブコミュニティを発見するための様々な手法が提案されている.HITS (Hyperlink-Induced Topic Search)アルゴリズムは数学的に扱いやすいこと,ウェブページにオーソリティやハブという意味付けができること等から,それに基づく様々なウェブコミュニティ抽出手法が提案されている.しかし,これらの手法は2階層のウェブコミュニティを想定しており,3階層以上のウェブコミュニティの抽出は困難である.本論文では,HITSアルゴリズムの考え方に基づいた,階層性を考慮したウェブコミュニティの抽出法を提案する.中間ノードの概念を導入し,中間ノードを含めたウェブコミュニティ抽出アルゴリズムを与える.実験を行い,HITSアルゴリズムを用いた典型的な手法では抽出できないウェブコミュニティが提案手法によって抽出できることを確認する.
|
|