|
本文PDFファイルを閲覧するには,ログインする必要があります.
左メニューよりログインして下さい.
|
セマンティクスを用いた複数テンソルの同時分解手法
中辻 真
誌名
電子情報通信学会論文誌 D
Vol.J105-D
No.6
pp.436-446 発行日: 2022/06/01 早期公開日: 2022/02/15 Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2021JDP7044 論文種別: 論文 専門分野: 自然言語処理 キーワード: テンソル分解, Semantic Web, 推薦システム, 機械学習,
本文: PDF(5.8MB)>>
あらまし:
Web上に整備されている大規模な知識ベースに存在するセマンティクスは,個別のサービスに蓄積されているユーザの行動ログの統合分析に活用できる.ユーザ行動は,三つ以上のオブジェクトを含む関係で表現でき(例:“ユーザ”が“ウェブページ”に“タグ付け”するなど)るため,テンソルはユーザ行動を表現するための合理的な方法論を提供する.近年提案されたSemantic Sensitive Tensor Factorization (SSTF) は,オブジェクトの背後にあるセマンティクス(例:アイテムのカテゴリ)を用い,テンソル分解を行い,ユーザー行動を高精度に予測できる.しかし,SSTFは一つのサービスに対するテンソル分解のみを取り扱うため,(1) 異質なサービスのデータセットを同時に扱う場合に起こるバランス問題,及び (2) 観測データが不十分な場合に発生する希薄問題を解決できない.本論文で提案するSemantic Sensitive Simultaneous Tensor Factorization (S3TF) は,(1) 個々のサービスのテンソルを作成し,個別にテンソル分解を実行するのではなく,同時に実行する.これにより,バランス問題に起因する予測精度の低下を回避できる.また,(2) 分散した行動ログの背後にあるセマンティクスを用い,テンソル分解時に意味的なバイアスをサービス間で共有する.これにより希薄問題を回避する.実世界のデータセットを用いた実験により,S3TFは,既存のテンソル分解手法よりも高い予測精度を達成し,また,サービスを跨る暗黙の関係を抽出できることを示した.
|
|
|