植村 渉


POMDPs環境のためのエピソード強化型強化学習法
植村 渉 上野 敦志 辰巳 昭治 
誌名:   電子情報通信学会論文誌 A
発行日: 2005/06/01
Vol. J88-A  No. 6  pp. 761-774
論文種別:  論文
専門分野: 人工知能
キーワード: 
強化学習Profit Sharing部分観測可能マルコフ決定過程不完全知覚問題
 あらまし | 本文:PDF(612.5KB)