Augmented Naive Bayes制約をもつベイジアンネットワーク分類器の厳密学習

菅原 聖太  植野 真臣  

誌名
電子情報通信学会論文誌 D   Vol.J103-D   No.4   pp.301-313
発行日: 2020/04/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2019JDP7011
論文種別: 論文
専門分野: 人工知能,データマイニング
キーワード: 
ベイジアンネットワーク,  分類器,  生成モデル,  機械学習,  確率的グラフィカルモデル,  

本文: PDF(444.5KB)>>
論文を購入




あらまし: 
ベイジアンネットワーク分類器(Bayesian Network Classifier: BNC)は離散変数を扱う高精度の分類器として知られている.BNCは生成モデルよりも識別モデルの方が分類精度が高いことが先行研究で報告されてきた.しかし,なぜ識別モデルの方が分類精度が高いかという理由については未だ明らかにされていない.本論では,まず識別モデルとしてのBNCと厳密に学習した生成モデルとしてのBNCの分類精度の比較実験を行った.その結果,生成モデルはサンプルサイズが大きいときは識別モデルより分類精度が高かった.一方で,サンプルサイズが小さい場合は,生成モデルでは目的変数の親変数が増加してしまい,パラメータ数の指数的増加によって分類精度が識別モデルよりも著しく低下していた.そこで,本論では,目的変数が親変数をもたないAugmented Naive Bayes(ANB)構造を制約とした,生成モデルとしてのBNCの厳密学習手法を提案する.生成モデルとしてのANBの説明変数はANB制約のないBNCにおける目的変数のマルコフブランケットに一致していると考えられる.そこで提案手法では,まず制約なしでBNCを厳密学習する.次に学習されたBNCの目的変数のマルコフブランケットのみを説明変数集合としたANB構造を制約としてBNCを学習する.リポジトリデータセットを用いた実験により,提案手法が従来の識別モデルのBNCよりも分類精度が有意に高いことを示す.