ウェブコミュニティチャート―膨大なウェブページを関連する話題を通して閲覧可能にするツール―

豊田 正史  吉田 聡  喜連川 優  

誌名
電子情報通信学会論文誌 D   Vol.J87-D1   No.2   pp.256-265
発行日: 2004/02/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1915
論文種別: 特集論文 (データ工学論文特集)
専門分野: データマイニング・データウェアハウス
キーワード: 
ウェブ,  リンク解析,  ウェブコミュニティ,  

本文: PDF(443.1KB)>>
論文を購入




あらまし: 
同じ話題に関心をもつ人々や組織によって作成されたウェブページの集合を自動的に抽出できるリンク解析の手法が,これまでに数多く提案されている.ウェブコミュニティと呼ばれるこれらの集合を用いて,ウェブ上に存在する話題を把握することが可能である.しかし既存の研究では,個々のウェブコミュニティの抽出に重きが置かれ,ウェブコミュニティ間の関連については考慮されてこなかった.本論文では,大規模なウェブアーカイブからウェブコミュニティを抽出し,関連するウェブコミュニティ同士を辺で結んだグラフを作成する手法を提案する.これをウェブコミュニティチャートと呼ぶ.我々の手法は,与えられたシードページに関連するページをリンク解析によって算出する関連ページアルゴリズムに基づいている.まず我々は,既存の関連ページアルゴリズムの精度を改善して,ユーザテストによる評価を行う.次に,改良版アルゴリズムを用いて,大規模な日本のウェブアーカイブからウェブコミュニティチャートの作成実験を行う.更に,完成したチャートについてウェブディレクトリとの比較を行い,チャートの特徴を示す.