打ち切りデータを用いた混合モデルのオンラインEMアルゴリズム

幸島 匡宏  清武 寛  松林 達史  塩原 寿子  戸田 浩之  

誌名
電子情報通信学会論文誌 D   Vol.J102-D   No.4   pp.277-288
発行日: 2019/04/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2018DEP0005
論文種別: 特集論文 (データ工学と情報マネジメント論文特集)
専門分野: オンラインアルゴリズム
キーワード: 
打ち切りデータ,  混合モデル,  指数型分布族,  EMアルゴリズム,  オンラインアルゴリズム,  

本文: PDF(3.1MB)>>
論文を購入




あらまし: 
本研究では,有名アーティストの音楽ライブや人気スポーツの国際試合などの大規模集客イベントにおける観客の会場到着時間や退場時間の分布を,イベント当日に逐次収集されるデータから推定する問題を考える.これらのイベントでは,チケット事前販売数や会場規模に基づき総来場者数に関する情報が利用できるため,到着済み(退場済み)の観客の到着時間だけでなく,ある時点であとどのくらい未到着(未退場)の観客がいるかという情報が利用できる.我々は上記の問題が打ち切りデータから確率モデルのパラメタをオンラインに推定する問題と捉えることができることを示し,混合モデルのパラメタをオンラインに推定する手法,オンラインEMCMアルゴリズムを提案する.提案手法は上記の入退場時間に関するデータだけでなく,機器故障のデータなど打ち切りデータとして表現される任意のデータに適用可能である.理論解析により,提案手法と自然勾配法の関係が示される.人工データ,実データに適用した実験結果により,提案手法は既存手法を上回る性能をもつことを示す.