確率的データストリームにおける情報理論に基づく指標を用いた正規表現パターン照合手法

杉浦 健人  石川 佳治  

誌名
電子情報通信学会論文誌 D   Vol.J101-D   No.4   pp.641-656
発行日: 2018/04/01
Online ISSN: 1881-0225
論文種別: 特集論文 (データ工学と情報マネジメント論文特集)
専門分野: ストリームデータマイニング
キーワード: 
確率的データストリーム,  複合イベント処理,  パターン照合,  正規表現,  

本文: PDF(1.5MB)
>>論文を購入


あらまし: 
機械学習技術を用いたセンシングデータの解析は近年活発に行われており,複合イベント処理などの更なる応用が期待されている.しかし,センサの精度や周囲の環境しだいで認識の正確さは落ちてしまうため,認識したイベントの不確実性を考慮する必要がある.そこで本論文では,認識結果が確率的データストリームとして表されることを想定し,確率的データストリーム上での正規表現パターン照合による複合イベント処理について述べる.まず,生起確率の大きい照合結果を単純に選ぶだけでは適切な照合結果が得られないことを示し,情報理論に基づく指標を用いた照合結果の選出を提案する.次に,非確率的データストリームにおけるパターン照合のセマンティクスを紹介し,確率的データストリームにおけるパターン照合の問題定義を定める.最後に,照合結果を効率的に得るために有限オートマトンを基にしたアルゴリズムを提案し,実データ及び人工データを用いた実験により提案手法の有効性と効率性を示す.