藤原 真一


POMDPs環境における状態遷移の部分的履歴を用いた強化学習法
藤原 真一 宮本 俊幸 
誌名:   電子情報通信学会論文誌 A
発行日: 2011/10/01
Vol. J94-A  No. 10  pp. 778-781
論文種別:  レター
専門分野: 
キーワード: 
強化学習部分観測マルコフ決定過程不完全知覚問題部分履歴
 あらまし | 本文:PDF(461.7KB)