キーワード : 部分観測可能マルコフ決定過程


摂動完全均衡に基づくマルチエージェント部分観測可能マルコフ決定過程のプラン構築
籔 悠一 横尾 真 岩崎 敦 
誌名:   電子情報通信学会論文誌 D
発行日: 2007/09/01
Vol. J90-D  No. 9 ; pp. 2314-2323
論文種別:  特集論文 (ソフトウェアエージェントとその応用論文特集)
専門分野: モデル/理論
キーワード: 
マルチエージェントシステムエージェントプランニング部分観測可能マルコフ決定過程摂動完全均衡
 あらまし | 本文:PDF(352KB)

POMDPs環境のためのエピソード強化型強化学習法
植村 渉 上野 敦志 辰巳 昭治 
誌名:   電子情報通信学会論文誌 A
発行日: 2005/06/01
Vol. J88-A  No. 6 ; pp. 761-774
論文種別:  論文
専門分野: 人工知能
キーワード: 
強化学習Profit Sharing部分観測可能マルコフ決定過程不完全知覚問題
 あらまし | 本文:PDF(612.5KB)