Augmented Naive Bayesによる大規模ベイジアンネットワーク分類器学習

菊谷 成慎  菅原 聖太  名取 和樹  植野 真臣  

誌名
電子情報通信学会論文誌 D   Vol.J104-D   No.1   pp.65-81
発行日: 2021/01/01
早期公開日: 2020/09/25
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2020JDP7008
論文種別: 論文
専門分野: 人工知能,データマイニング
キーワード: 
ベイジアンネットワーク,  確率的グラフィカルモデル,  機械学習,  分類器,  制約ベースアプローチ,  

本文: PDF(12.4MB)>>
論文を購入




あらまし: 
ベイジアンネットワーク分類器(Bayesian Network Classifier: BNC)は確率モデルによる分類器である.BNCの構造学習はこれまで候補構造から近似的に識別モデルの学習スコアが最大となる構造を探索する手法が用いられてきた.近年,菅原ら(2020)はベイジアンネットワークの学習スコアにより厳密学習したBNCは分類精度が低いとは限らないと報告している.更に彼らは,構造にAugmented Naive Bayes(ANB)を仮定し生成モデルとしてBNCを厳密学習する手法を提案した.これによりデータが少ない場合も分類精度の高いBNCを学習できることを示した.しかし,厳密学習は変数の増加に対して計算量が指数的に増加するため,菅原ら(2020)の手法は数十変数のANB学習が限界である.そこで,本論文では大規模変数をもつBNCを学習できる手法を提案する.因果モデルの研究分野では,条件付き独立性検定(CIテスト)とエッジの方向付けによる計算効率の高い構造学習法が提案されており,制約ベースアプローチと呼ぶ.名取らは,CIテストにBayes factorを用いることで真の構造への漸近一致性を有しつつ1000変数以上の構造学習を実現し,本田らはその手法に推移性を組み込むことで3500変数の構造学習を実現した.そこで本論文では,本田らの手法を用いて従来より大規模なANBを学習できる手法を提案し,提案手法がANB構造について漸近的にパラメータ数を最小にして真の同時確率分布に収束することを示す.実験により,大規模構造学習において提案手法が有用であることを示す.