著者キーワード中での共起に基づく専門用語間の関連度計算法

相澤 彰子  影浦 峡  

誌名
電子情報通信学会論文誌 D   Vol.J83-D1   No.11   pp.1154-1162
発行日: 2000/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1915
論文種別: 論文
専門分野: ソフトウェアシステム
キーワード: 
共起頻度,  文脈ベクトル,  シソーラス自動構築,  テキスト分類,  学術文献データベース,  

本文: PDF(371.1KB)>>
論文を購入




あらまし: 
本論文では,学術文献に与えられる著者キーワード中での共起情報を利用して,専門用語の間の関連度を計算する方法について検討する.学術文献データベースに登録された著者キーワード項目を利用すると,独立した複合語を単位とする共起情報を簡単に得ることができるが,一つの文献についてたかだか数語が共起するのみであることから,データのスパース性の問題が生じる.そこで本論文では,関連度の計算において間接的な共起関係をも考慮することとし,文献ごとのキーワード集合を共起関係リンクで結んだ大規模な用語グラフを作成した上で,平均経路長を用いて任意の二つの用語集合間の距離を定義する.また,実際に大規模な学術文献データベースを用いて作成した用語グラフをテキストの自動分類問題に適用することによって,提案する関連度計算法のもっともらしさを評価し,直接共起や出現文脈ベクトルを用いる場合と比較を行う.