2体エージェント確率ゲームにおける他エージェントの政策推定を利用した強化学習法

長行 康男
伊藤 実

誌名
電子情報通信学会論文誌 D   Vol.J86-D1    No.11    pp.821-829
発行日: 2003/11/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1915
論文種別: 論文
専門分野: 分散協調とエージェント
キーワード: 
マルチエージェント強化学習,  Q学習,  2体エージェント確率ゲーム,  政策推定,  行動予測,  

本文: PDF(311.8KB)>>
論文を購入



あらまし: 
本論文では,2体エージェント確率ゲームにおける新たな強化学習法を提案する.提案する手法では,他エージェントが実際に実行した行動の観測情報をもとに他エージェントの政策(行動決定関数)を推定し,その推定した政策を利用して他エージェントが未来に実行する行動を予測する.そして,その予測行動を利用しながら強化学習を進行する.提案した手法を2体エージェント確率ゲームの枠組みでモデル化した追跡問題に適用し,実験を行い,提案手法の有効性を示す.