アンサンブル学習によるモデル平均ベイジアンネットワーク分類器

青見 樹  菅原 聖太  植野 真臣  

誌名
電子情報通信学会論文誌 D   Vol.J103-D   No.3   pp.183-193
発行日: 2020/03/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2019JDP7059
論文種別: 論文
専門分野: 人工知能,データマイニング
キーワード: 
ベイジアンネットワーク,  確率的グラフィカルモデル,  機械学習,  分類器,  アンサンブル学習,  

本文: PDF(426.5KB)>>
論文を購入




あらまし: 
ベイジアンネットワーク分類器(Bayesian Network Classifier: BNC)について,説明変数を所与とした目的変数の条件付き確率をモデル化したBNC (識別モデル)が,周辺ゆう度を用いて学習したBNC (生成モデル)に対し,分類精度が高くなると報告されている.これは,周辺ゆう度は漸近一致性をもつため,データ数が少ない場合に生成モデルの各構造の事後確率が低くなり,真の確率分布をうまく近似できなくなってしまうからであると考えられる.このような場合,全てのモデル候補を用いて推論するモデル平均が有効であることが知られている.しかし,ベイジアンネットワークの候補構造は変数数に対して指数的に増加し,計算が困難である.この計算困難性を解決するために,構造を確率の高い順にK個選択するk-best法が知られているが,選択される構造が類似してしまう傾向があり,分類精度が劣化してしまう可能性がある.本研究では,選択される構造が類似しないように,データセットからアンサンブル法により構造学習した複数の構造についてモデル平均を行うBNCを提案する.評価実験により,モデル平均を行う構造間の類似度が低下する場合に分類精度が向上することを示し,更にk-best法とアンサンブル法を組み合わせた手法が,小規模データで有効かつデータ規模にかかわらず既存手法と比べ分類精度が高くなることを示す.