深層強化学習Agentの離散行動空間タスクにおける重み付き結合

佐藤 件一郎  幸島 匡宏  松林 達史  戸田 浩之  
(データ工学研究専門委員会推薦論文)

誌名
電子情報通信学会論文誌 D   Vol.J103-D   No.5   pp.403-414
発行日: 2020/05/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2019DET0002
論文種別: 特集論文 (データ工学と情報マネジメント論文特集)
専門分野: 深層強化学習
キーワード: 
強化学習,  深層強化学習,  最大エントロピー強化学習,  構成性,  信号制御,  

本文: PDF(3.2MB)>>
論文を購入




あらまし: 
近年強化学習の研究領域において,それぞれが異なるタスクを解く複数の学習済みAgentを結合することで,新たなタスクを解くAgentを構成するアプローチの研究が進められている.本研究では,単純平均をとることで学習済みAgentを結合する既存技術を拡張し,重み付き和によるAgentの結合を行う手法を提案する.これにより報酬が学習済みタスクの線形和として定義される新たなタスクの問題を解くことが可能になる.CartPole制御と適応信号制御という二つの実験を通して提案手法の有効性を検証した.