キーワード : 部分観測マルコフ決定過程


POMDPs環境における状態遷移の部分的履歴を用いた強化学習法
藤原 真一 宮本 俊幸 
誌名:   電子情報通信学会論文誌 A
発行日: 2011/10/01
Vol. J94-A  No. 10 ; pp. 778-781
論文種別:  レター
専門分野: 
キーワード: 
強化学習部分観測マルコフ決定過程不完全知覚問題部分履歴
 あらまし | 本文:PDF(461.7KB)

複素数で表現された行動価値を用いるQ-learning
澁谷 長史 濱上 知樹 
誌名:   電子情報通信学会論文誌 D
発行日: 2008/05/01
Vol. J91-D  No. 5 ; pp. 1286-1295
論文種別:  論文
専門分野: 人工知能,認知科学
キーワード: 
強化学習Q-learning部分観測マルコフ決定過程不完全知覚問題
 あらまし | 本文:PDF(392.6KB)

部分観測マルコフ決定過程下の強化学習のためのパルスニューラルネットワーク学習則
瀧田 航一朗 萩原 将文 
誌名:   電子情報通信学会論文誌 D
発行日: 2003/07/01
Vol. J86-D2  No. 7 ; pp. 1067-1077
論文種別:  論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
パルスニューラルネットワーク強化学習部分観測マルコフ決定過程
 あらまし | 本文:PDF(1.2MB)