澁谷 長史


選択的不感化ニューラルネットを用いた連続状態行動空間におけるQ学習
小林 高彰 澁谷 長史 森田 昌彦 
誌名:   電子情報通信学会論文誌 D
発行日: 2015/02/01
Vol. J98-D  No. 2  pp. 287-299
論文種別:  論文
専門分野: 人工知能,データマイニング
キーワード: 
強化学習行動価値関数Q値関数近似
 あらまし | 本文:PDF(722.8KB)

複素数で表現された行動価値を用いるQ-learning
澁谷 長史 濱上 知樹 
誌名:   電子情報通信学会論文誌 D
発行日: 2008/05/01
Vol. J91-D  No. 5  pp. 1286-1295
論文種別:  論文
専門分野: 人工知能,認知科学
キーワード: 
強化学習Q-learning部分観測マルコフ決定過程不完全知覚問題
 あらまし | 本文:PDF(392.6KB)