条件付き確率の保守的な推定

菊地 真人  山本 英子  吉田 光男  岡部 正幸  梅村 恭司  

誌名
電子情報通信学会論文誌 D   Vol.J100-D   No.4   pp.544-555
発行日: 2017/04/01
Online ISSN: 1881-0225
論文種別: 特集論文 (データ工学と情報マネジメント論文特集)
専門分野: 確率推定
キーワード: 
条件付き確率,  信頼区間,  下限値,  保守的な推定,  

本文: PDF(1.1MB)
>>論文を購入


あらまし: 
本論文では,観測頻度から条件付き確率を推定するという問題に取り組む.条件付き確率の推定は,データマイニングや実際の応用における基本的な操作であり,その推定方法によって手法の正確さが左右されることがある.一般に,確率推定では最ゆう推定値が用いられるが,低頻度に弱いという問題がある.この問題に対処するため,ベイズの枠組みがよく用いられる.ベイズの枠組みでは,データについての事前分布を推定し,事後分布の期待値を用いる.しかし,データをもとに事前分布を推定することは容易ではない.そこで,本論文では,事前分布として何らかの分布を仮定して事後分布の信頼区間を求め,その下限値を用いる手法を提案する.期待値は偏りのない推定値となる一方で,信頼区間の下限値は条件付き確率を保守的に見積もった推定値となる.実験によって,提案手法が低頻度に頑強であることを示す.更に,提案手法は事前分布として一様分布を用いた場合,ベイズの枠組みを用いた手法とほぼ同じ性能を獲得しうることを示す.