本木 雄斗


状態表現と報酬関数の相互設計法における実験的考察
本木 雄斗 荒井 幸代 吉永 和史 
誌名:   
発行日: 2018/09/01
Vol. J101-D  No. 9  pp. 1295-1304
論文種別:  特集論文 (ソフトウェアエージェントとその応用論文特集)
専門分野: 理論
キーワード: 
強化学習逆強化学習報酬設計状態表現
 あらまし | 本文:PDF(1.3MB)