銅谷 賢治


自然方策こう配法:平均報酬の自然こう配に基づく方策探索
森村 哲郎 内部 英治 吉本 潤一郎 銅谷 賢治 
誌名:   電子情報通信学会論文誌 D
発行日: 2008/06/01
Vol. J91-D  No. 6  pp. 1515-1527
論文種別:  論文
専門分野: 人工知能,認知科学
キーワード: 
強化学習自然こう配法リーマン計量行列方策こう配法マルコフ決定過程
 あらまし | 本文:PDF(457KB)

Max-Min Actor-Criticによる複数報酬課題の強化学習
上岡 拓未 内部 英治 銅谷 賢治 
誌名:   電子情報通信学会論文誌 D
発行日: 2007/09/01
Vol. J90-D  No. 9  pp. 2510-2521
論文種別:  論文
専門分野: 人工知能,認知科学
キーワード: 
多目的最適化強化学習Max-Min最適方策報酬設計
 あらまし | 本文:PDF(536.7KB)

MOSAICモデルにより環境を抽象化する階層型強化学習
杉本 徳和 鮫島 和行 銅谷 賢治 川人 光男 
誌名:   電子情報通信学会論文誌 D
発行日: 2006/07/01
Vol. J89-D  No. 7  pp. 1577-1587
論文種別:  論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
強化学習階層構造モジュール構造連続システム状態の抽象化
 あらまし | 本文:PDF(422.3KB)

方策こう配法を用いた動的行動則の獲得:2足歩行運動への適用
松原 崇充 森本 淳 中西 淳 佐藤 雅昭 銅谷 賢治 
誌名:   電子情報通信学会論文誌 D
発行日: 2005/01/01
Vol. J88-D2  No. 1  pp. 53-65
論文種別:  論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
強化学習動的行動則方策こう配法2足歩行central pattern generator
 あらまし | 本文:PDF(1.6MB)

複数の状態予測と報酬予測モデルによる強化学習と行動目標の推定
杉本 徳和 鮫島 和行 銅谷 賢治 川人 光男 
誌名:   電子情報通信学会論文誌 D
発行日: 2004/02/01
Vol. J87-D2  No. 2  pp. 683-694
論文種別:  論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
モジュール分割強化学習非線形制御見まね学習
 あらまし | 本文:PDF(1.5MB)

モジュール競合による運動パターンのシンボル化と見まね学習
鮫島 和行 片桐 憲一 銅谷 賢治 川人 光男 
誌名:   電子情報通信学会論文誌 D
発行日: 2002/01/01
Vol. J85-D2  No. 1  pp. 90-100
論文種別:  論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
MOSAICシンボル化見まね学習acrobot
 あらまし | 本文:PDF(844.8KB)

複数の予測モデルを用いた強化学習による非線形制御
鮫島 和行 片桐 憲一 銅谷 賢治 川人 光男 
誌名:   電子情報通信学会論文誌 D
発行日: 2001/09/01
Vol. J84-D2  No. 9  pp. 2092-2106
論文種別:  論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
モジュール分割モデルベース強化学習非線形制御linear quadratic controller
 あらまし | 本文:PDF(1.2MB)

マルチステップ状態予測を用いた強化学習によるドライバモデル
小池 康晴 銅谷 賢治 
誌名:   電子情報通信学会論文誌 D
発行日: 2001/02/01
Vol. J84-D2  No. 2  pp. 370-379
論文種別:  論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
強化学習フォワードモデル視線自動運転
 あらまし | 本文:PDF(1.1MB)

経由点表現を用いた強化学習
宮本 弘之 森本 淳 銅谷 賢治 川人 光男 
誌名:   電子情報通信学会論文誌 D
発行日: 1999/11/25
Vol. J82-D2  No. 11  pp. 2111-2117
論文種別:  論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
強化学習経由点運動制御ロボティクス振り子の振り上げ
 あらまし | 本文:PDF(577.4KB)

強化学習を用いた高次元連続状態空間における系列運動学習 ―起き上がり運動の獲得―
森本 淳 銅谷 賢治 
誌名:   電子情報通信学会論文誌 D
発行日: 1999/11/25
Vol. J82-D2  No. 11  pp. 2118-2131
論文種別:  論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
強化学習Actor-critic法動径基底関数(RBF)正規化ガウス関数ネットワーク起き上がりロボット
 あらまし | 本文:PDF(1.3MB)

時間パターンの記憶の神経回路網モデル
銅谷 賢治 吉澤 修治 
誌名:   電子情報通信学会論文誌 D
発行日: 1990/08/25
Vol. J73-D2  No. 8  pp. 1150-1157
論文種別:  特集論文 (ニューロコンピューティング論文特集)
専門分野: 学習のアルゴリズムと理論
キーワード: 
 あらまし | 本文:PDF(580.6KB)