セマンティクスを用いた複数テンソルの同時分解手法

中辻 真

誌名
電子情報通信学会論文誌 D   Vol.J105-D    No.6    pp.436-446
発行日: 2022/06/01
早期公開日: 2022/02/15
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2021JDP7044
論文種別: 論文
専門分野: 自然言語処理
キーワード: 
テンソル分解,  Semantic Web,  推薦システム,  機械学習,  

本文: PDF(5.8MB)>>
論文を購入



あらまし: 
Web上に整備されている大規模な知識ベースに存在するセマンティクスは,個別のサービスに蓄積されているユーザの行動ログの統合分析に活用できる.ユーザ行動は,三つ以上のオブジェクトを含む関係で表現でき(例:“ユーザ”が“ウェブページ”に“タグ付け”するなど)るため,テンソルはユーザ行動を表現するための合理的な方法論を提供する.近年提案されたSemantic Sensitive Tensor Factorization (SSTF) は,オブジェクトの背後にあるセマンティクス(例:アイテムのカテゴリ)を用い,テンソル分解を行い,ユーザー行動を高精度に予測できる.しかし,SSTFは一つのサービスに対するテンソル分解のみを取り扱うため,(1) 異質なサービスのデータセットを同時に扱う場合に起こるバランス問題,及び (2) 観測データが不十分な場合に発生する希薄問題を解決できない.本論文で提案するSemantic Sensitive Simultaneous Tensor Factorization (S3TF) は,(1) 個々のサービスのテンソルを作成し,個別にテンソル分解を実行するのではなく,同時に実行する.これにより,バランス問題に起因する予測精度の低下を回避できる.また,(2) 分散した行動ログの背後にあるセマンティクスを用い,テンソル分解時に意味的なバイアスをサービス間で共有する.これにより希薄問題を回避する.実世界のデータセットを用いた実験により,S3TFは,既存のテンソル分解手法よりも高い予測精度を達成し,また,サービスを跨る暗黙の関係を抽出できることを示した.