竹木 祥太


期待報酬ベクトルのチェビシェフスカラー化によるパレート最適方策の網羅的発見法
齋竹 良介 竹木 祥太 荒井 幸代 
誌名:   
発行日: 2018/09/01
Vol. J101-D  No. 9  pp. 1276-1285
論文種別:  特集論文 (ソフトウェアエージェントとその応用論文特集)
専門分野: 理論
キーワード: 
多目的最適化強化学習多目的強化学習パレート最適方策
 あらまし | 本文:PDF(1.6MB)