|
|
キーワード : 強化学習
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2人2行動対称ゲームのための学習率調整Q学習 森山 甲一
|
誌名: 電子情報通信学会論文誌 D
発行日: 2009/11/01
Vol. J92-D
No. 11
pp. 1819-1826
論文種別: 特集論文 (ソフトウェアエージェントとその応用論文特集)
専門分野: モデル/理論 キーワード: 強化学習,
マルチエージェントシステム,
囚人のジレンマ,
ゲーム理論,
|
| |
あらまし |
本文:PDF
(574.7KB)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
強化学習と隠れマルコフモデルの結合による自律的な動作認識 諸岡 健一
浜元 和久
長橋 宏
|
誌名: 電子情報通信学会論文誌 D
発行日: 2005/07/01
Vol. J88-D2
No. 7
pp. 1269-1277
論文種別: 論文
専門分野: バイオサイバネティックス,ニューロコンピューティング キーワード: 動作生成,
動作認識,
強化学習,
隠れマルコフモデル,
|
| |
あらまし |
本文:PDF
(767.7KB)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
マルチエージェント系における行動学習への方策こう配法の適用―追跡問題― 石原 聖司
五十嵐 治一
|
誌名: 電子情報通信学会論文誌 D
発行日: 2004/03/01
Vol. J87-D1
No. 3
pp. 390-397
論文種別: 論文
専門分野: 分散協調とエージェント キーワード: 強化学習,
方策こう配法,
追跡問題,
マルチエージェント系,
|
| |
あらまし |
本文:PDF
(211.4KB)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ラットの空間探索課題における海馬-大脳基底核モデル 伊藤 真
三宅 章吾
沢田 康次
|
誌名: 電子情報通信学会論文誌 D
発行日: 2001/09/01
Vol. J84-D2
No. 9
pp. 2107-2120
論文種別: 論文
専門分野: バイオサイバネティックス,ニューロコンピューティング キーワード: 海馬,
大脳基底核,
強化学習,
場所細胞,
|
| |
あらまし |
本文:PDF
(1.7MB)
|
|
|
|
|
|
|
|
|
マクロオペレータの部分的再利用による強化学習システムの動的環境への適応能力の改善 嶋田 総太郎
安西 祐一郎
|
誌名: 電子情報通信学会論文誌 D
発行日: 2001/07/01
Vol. J84-D1
No. 7
pp. 1076-1088
論文種別: 論文
専門分野: 人工知能,認知科学 キーワード: 強化学習,
動的環境,
マルコフ決定過程,
マクロオペレータ,
|
| |
あらまし |
本文:PDF
(854.7KB)
|
|
|
動的環境下におけるProfit Sharing 加藤 新吾
松尾 啓志
|
誌名: 電子情報通信学会論文誌 D
発行日: 2001/07/01
Vol. J84-D1
No. 7
pp. 1067-1075
論文種別: 論文
専門分野: 人工知能,認知科学 キーワード: 強化学習,
profit sharing,
動的環境,
|
| |
あらまし |
本文:PDF
(668KB)
|
|
|
不揮発性ユニットを含む2次元セル型神経回路網の提案 平津 大輔
長尾 智晴
|
誌名: 電子情報通信学会論文誌 D
発行日: 2001/03/01
Vol. J84-D2
No. 3
pp. 571-579
論文種別: 論文
専門分野: バイオサイバネティックス,ニューロコンピューティング キーワード: セル型神経回路網,
遺伝的アルゴリズム,
人工生命,
強化学習,
|
| |
あらまし |
本文:PDF
(838.6KB)
|
|
|
知覚情報の粗視化によるマルチエージェント強化学習の高速化−ハンターゲームを例に− 伊藤 昭
金渕 満
|
誌名: 電子情報通信学会論文誌 D
発行日: 2001/03/01
Vol. J84-D1
No. 3
pp. 285-293
論文種別: 論文
専門分野: 分散協調とエージェント キーワード: マルチエージェント,
強化学習,
粗視化,
|
| |
あらまし |
本文:PDF
(761.1KB)
|
|
|
|
|
|
マルチステップ状態予測を用いた強化学習によるドライバモデル 小池 康晴
銅谷 賢治
|
誌名: 電子情報通信学会論文誌 D
発行日: 2001/02/01
Vol. J84-D2
No. 2
pp. 370-379
論文種別: 論文
専門分野: バイオサイバネティックス,ニューロコンピューティング キーワード: 強化学習,
フォワードモデル,
視線,
自動運転,
|
| |
あらまし |
本文:PDF
(1.1MB)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|