ハイパリンクで結ばれた隣接ページの内容に基づくWebページのためのTF-IDF法の改良

杉山 一成  波多野 賢治  吉川 正俊  植村 俊亮  

誌名
電子情報通信学会論文誌 D   Vol.J87-D1   No.2   pp.113-125
発行日: 2004/02/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1915
論文種別: 特集論文 (データ工学論文特集)
専門分野: 情報検索・文書分類
キーワード: 
WWW,  情報検索,  TF-IDF法,  ハイパリンク,  

本文: PDF(803.7KB)
>>論文を購入


あらまし: 
ベクトル空間法に基づいた情報検索システムでは,文書を特徴づけるために,しばしばTF-IDF法が用いられる.しかし,Webページのようなハイパリンク構造を有する文書の場合には,ハイパリンクで結ばれた隣接ページの内容を利用することによって,より正確にWebページの内容を特徴づけられると考えられる.そこで本論文では,ハイパリンクで結ばれた隣接ページの内容を用いて,Webページ向けにTF-IDF法を改良するための手法を提案し,その手法の有効性を確認する.