摂動完全均衡に基づくマルチエージェント部分観測可能マルコフ決定過程のプラン構築

籔 悠一  横尾 真  岩崎 敦  

誌名
電子情報通信学会論文誌 D   Vol.J90-D   No.9   pp.2314-2323
発行日: 2007/09/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (ソフトウェアエージェントとその応用論文特集)
専門分野: モデル/理論
キーワード: 
マルチエージェントシステム,  エージェントプランニング,  部分観測可能マルコフ決定過程,  摂動完全均衡,  

本文: PDF(352KB)
>>論文を購入


あらまし: 
本論文では,摂動完全均衡に基づいたマルチエージェント部分観測可能マルコフ決定過程のプラン構築アルゴリズムを提案する.マルチエージェント部分観測可能マルコフ決定過程 (Partially Observable Markov Decision Process,POMDP) とは不確実な状況下におけるマルチエージェントシステムをモデル化する一手法である.マルチエージェントPOMDPにおいて大域的最適解を求めるのは非常に困難である.このため,ナッシュ均衡に基づいて,エージェントの期待利得を最大化し局所的最適解を探索するアルゴリズムが提案されてきた.しかし,この従来手法の性能はアルゴリズムに与える初期設定に大きく依存するため,性能が極端に低下し得る.そこで本論文では,アルゴリズムの初期設定への依存度を小さくするため,ナッシュ均衡の代わりに摂動完全均衡を導入したアルゴリズムを提案する.摂動完全均衡とはエージェントがある微小な確率でエラーを起こすことを考慮して,エージェントの期待利得を求める概念である.最後に計算機実験により,提案手法が従来手法より性能が高くなる条件を示した.