WEBコミュニティ発見のためのHITSアルゴリズムの分析と改善

野村 早恵子  小山 聡  早水 哲雄  石田 亨  

誌名
電子情報通信学会論文誌 D   Vol.J85-D1   No.8   pp.741-750
発行日: 2002/08/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1915
論文種別: 論文
専門分野: データベース
キーワード: 
World Wide Web,  リンク解析,  Webコミュニティ,  情報可視化,  固有値計算,  

本文: PDF(936.2KB)>>
論文を購入




あらまし: 
本研究では,Web特有のハイパリンク解析からWebコミュニティを抽出するKleinbergのHITS(Hyperlink-Induced Topic Search)アルゴリズムの問題点を分析し,改良を行った.分析のために,HITSアルゴリズム動作過程可視化ツール(LinkViewer)を開発した.分析結果から得られたHITSアルゴリズムの問題点は,base集合には本来のトピックには全く関係のないページが密なリンク構造をもつ場合,本来のトピックに見合ったWebコミュニティ(authorityとhub)を抽出することができないことであった(topic drift問題).これに対し,我々は,リンク解析のみに焦点を絞り以下の修正法を提案した.1)固有値計算を行う際にroot部分空間に射影を行う手法,2)root集合に含まれる複数のページとリンク関係をもつページのみをbase集合から取り出して反復計算する手法,及び2)に1)を組み合わせて適用した手法である.結果として,比較的少ない計算量で,いずれのトピックでもtopic driftの問題が是正され,リンク情報を用いたHITSアルゴリズムの改善に成功した.