キーワード : 不完全知覚問題


POMDPs環境における状態遷移の部分的履歴を用いた強化学習法
藤原 真一 宮本 俊幸 
誌名:   電子情報通信学会論文誌 A
発行日: 2011/10/01
Vol. J94-A  No. 10 ; pp. 778-781
論文種別:  レター
専門分野: 
キーワード: 
強化学習部分観測マルコフ決定過程不完全知覚問題部分履歴
 あらまし | 本文:PDF(461.7KB)

逐次的に分割された問題空間における複素強化学習
山崎 惇広 濱上 知樹 
誌名:   電子情報通信学会論文誌 D
発行日: 2011/05/01
Vol. J94-D  No. 5 ; pp. 872-880
論文種別:  論文
専門分野: 人工知能,データマイニング
キーワード: 
強化学習複素強化学習HQ-learning不完全知覚問題
 あらまし | 本文:PDF(647.4KB)

複素数で表現された行動価値を用いるQ-learning
澁谷 長史 濱上 知樹 
誌名:   電子情報通信学会論文誌 D
発行日: 2008/05/01
Vol. J91-D  No. 5 ; pp. 1286-1295
論文種別:  論文
専門分野: 人工知能,認知科学
キーワード: 
強化学習Q-learning部分観測マルコフ決定過程不完全知覚問題
 あらまし | 本文:PDF(392.6KB)

POMDPs環境のためのエピソード強化型強化学習法
植村 渉 上野 敦志 辰巳 昭治 
誌名:   電子情報通信学会論文誌 A
発行日: 2005/06/01
Vol. J88-A  No. 6 ; pp. 761-774
論文種別:  論文
専門分野: 人工知能
キーワード: 
強化学習Profit Sharing部分観測可能マルコフ決定過程不完全知覚問題
 あらまし | 本文:PDF(612.5KB)