| キーワード : 強化学習
| |
| |
| |
|
深層強化学習を用いた不確かな入力遅延のある非線形システムの安定化 池本 隼也 潮 俊光 | 誌名:
発行日: 2019/10/01
Vol. J102-A
No. 10 ;
pp. 268-271
論文種別:
レター
専門分野: キーワード: 制御入力遅延, 強化学習, 深層強化学習, | | あらまし | 本文:PDF(543.9KB) | |
| |
|
状態表現と報酬関数の相互設計法における実験的考察 本木 雄斗 荒井 幸代 吉永 和史 | 誌名:
発行日: 2018/09/01
Vol. J101-D
No. 9 ;
pp. 1295-1304
論文種別:
特集論文 (ソフトウェアエージェントとその応用論文特集)
専門分野: 理論 キーワード: 強化学習, 逆強化学習, 報酬設計, 状態表現, | | あらまし | 本文:PDF(1.3MB) | |
| |
| |
|
複雑ネットワーク上での影響力の伝搬によるノルムの収束について 渋澤 亮介 菅原 俊治 | 誌名: 電子情報通信学会論文誌 D
発行日: 2015/06/01
Vol. J98-D
No. 6 ;
pp. 873-883
論文種別:
特集論文 (ソフトウェアエージェントとその応用論文特集)
専門分野: エージェントベースシミュレーション キーワード: ノルム, 複雑ネットワーク, 影響力, 強化学習, マルチエージェントシステム, | | あらまし | 本文:PDF(3.6MB) | |
|
選択的不感化ニューラルネットを用いた連続状態行動空間におけるQ学習 小林 高彰 澁谷 長史 森田 昌彦 | 誌名: 電子情報通信学会論文誌 D
発行日: 2015/02/01
Vol. J98-D
No. 2 ;
pp. 287-299
論文種別:
論文
専門分野: 人工知能,データマイニング キーワード: 強化学習, 行動価値関数, Q値, 関数近似, | | あらまし | 本文:PDF(722.8KB) | |
| |
| |
| |
| |
| |
| |
| |
| |
|
2人2行動対称ゲームのための学習率調整Q学習 森山 甲一 | 誌名: 電子情報通信学会論文誌 D
発行日: 2009/11/01
Vol. J92-D
No. 11 ;
pp. 1819-1826
論文種別:
特集論文 (ソフトウェアエージェントとその応用論文特集)
専門分野: モデル/理論 キーワード: 強化学習, マルチエージェントシステム, 囚人のジレンマ, ゲーム理論, | | あらまし | 本文:PDF(576.4KB) | |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
|
強化学習と隠れマルコフモデルの結合による自律的な動作認識 諸岡 健一 浜元 和久 長橋 宏 | 誌名: 電子情報通信学会論文誌 D
発行日: 2005/07/01
Vol. J88-D2
No. 7 ;
pp. 1269-1277
論文種別:
論文
専門分野: バイオサイバネティックス,ニューロコンピューティング キーワード: 動作生成, 動作認識, 強化学習, 隠れマルコフモデル, | | あらまし | 本文:PDF(765.6KB) | |
| |
| |
| |
| |
| |
| |
| |
| |
|
マルチエージェント系における行動学習への方策こう配法の適用―追跡問題― 石原 聖司 五十嵐 治一 | 誌名: 電子情報通信学会論文誌 D
発行日: 2004/03/01
Vol. J87-D1
No. 3 ;
pp. 390-397
論文種別:
論文
専門分野: 分散協調とエージェント キーワード: 強化学習, 方策こう配法, 追跡問題, マルチエージェント系, | | あらまし | 本文:PDF(212.2KB) | |
| |
| |
| |
| |
| |
| |
| |
| |
| |
|
ラットの空間探索課題における海馬-大脳基底核モデル 伊藤 真 三宅 章吾 沢田 康次 | 誌名: 電子情報通信学会論文誌 D
発行日: 2001/09/01
Vol. J84-D2
No. 9 ;
pp. 2107-2120
論文種別:
論文
専門分野: バイオサイバネティックス,ニューロコンピューティング キーワード: 海馬, 大脳基底核, 強化学習, 場所細胞, | | あらまし | 本文:PDF(1.7MB) | |
| |
|
マクロオペレータの部分的再利用による強化学習システムの動的環境への適応能力の改善 嶋田 総太郎 安西 祐一郎 | 誌名: 電子情報通信学会論文誌 D
発行日: 2001/07/01
Vol. J84-D1
No. 7 ;
pp. 1076-1088
論文種別:
論文
専門分野: 人工知能,認知科学 キーワード: 強化学習, 動的環境, マルコフ決定過程, マクロオペレータ, | | あらまし | 本文:PDF(852.5KB) | |
|
動的環境下におけるProfit Sharing 加藤 新吾 松尾 啓志 | 誌名: 電子情報通信学会論文誌 D
発行日: 2001/07/01
Vol. J84-D1
No. 7 ;
pp. 1067-1075
論文種別:
論文
専門分野: 人工知能,認知科学 キーワード: 強化学習, profit sharing, 動的環境, | | あらまし | 本文:PDF(664.8KB) | |
|
知覚情報の粗視化によるマルチエージェント強化学習の高速化-ハンターゲームを例に- 伊藤 昭 金渕 満 | 誌名: 電子情報通信学会論文誌 D
発行日: 2001/03/01
Vol. J84-D1
No. 3 ;
pp. 285-293
論文種別:
論文
専門分野: 分散協調とエージェント キーワード: マルチエージェント, 強化学習, 粗視化, | | あらまし | 本文:PDF(758.1KB) | |
|
不揮発性ユニットを含む2次元セル型神経回路網の提案 平津 大輔 長尾 智晴 | 誌名: 電子情報通信学会論文誌 D
発行日: 2001/03/01
Vol. J84-D2
No. 3 ;
pp. 571-579
論文種別:
論文
専門分野: バイオサイバネティックス,ニューロコンピューティング キーワード: セル型神経回路網, 遺伝的アルゴリズム, 人工生命, 強化学習, | | あらまし | 本文:PDF(835.9KB) | |
|
マルチステップ状態予測を用いた強化学習によるドライバモデル 小池 康晴 銅谷 賢治 | 誌名: 電子情報通信学会論文誌 D
発行日: 2001/02/01
Vol. J84-D2
No. 2 ;
pp. 370-379
論文種別:
論文
専門分野: バイオサイバネティックス,ニューロコンピューティング キーワード: 強化学習, フォワードモデル, 視線, 自動運転, | | あらまし | 本文:PDF(1.1MB) | |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
|
|