異粒度データ分析のための非負値行列分解に基づく確率モデル

幸島 匡宏  松林 達史  澤田 宏  

誌名
電子情報通信学会論文誌 D   Vol.J100-D   No.4   pp.520-529
発行日: 2017/04/01
Online ISSN: 1881-0225
論文種別: 特集論文 (データ工学と情報マネジメント論文特集)
専門分野: 機械学習
キーワード: 
異粒度データ,  確率モデル,  非負値行列分解,  集合行列分解,  

本文: PDF(3.1MB)
>>論文を購入


あらまし: 
近年,網羅的なデータ収集の困難さや個人情報保護の観点から,ユーザ個人を単位とする粒度の細かいデータと年代・性別などの属性情報でまとめられたユーザ集団を単位とする粒度の粗いデータといった,異なる粒度のデータを扱う機会が増えている.本研究では,個人単位・集団単位のデータの組のように,粒度の異なる複数のデータを組み合わせて分析するための新たな手法を提案する.提案手法は,非負値行列分解に基づく新たな確率モデルである.このモデルは粒度の粗い方のデータの背後に存在するデータを潜在変数として導入することで導かれる.実購買履歴を用いた実験を通して,提案手法は既存手法を上回る性能を示したこと,低解像度のデータ数が増えるに従い性能向上が達成されることを確認した.更に上記提案手法に基づく拡張手法を導出することで,提案手法が様々な異粒度データ分析問題を考える際の基盤的アプローチとなりうることを示す.