キーワード : マルコフ決定過程


線形時相論理仕様を満たす階層的制御への強化学習の応用
山倉 佑馬 潮 俊光 
誌名:   
発行日: 2019/10/01
Vol. J102-A  No. 10 ; pp. 254-263
論文種別:  論文
専門分野: システム数理と応用
キーワード: 
マルコフ決定過程強化学習線形時相論理式ラビンオートマトン
 あらまし | 本文:PDF(783.3KB)

ノンプレイヤキャラクタを伴うロールプレイングゲームの攻略法に関する一考察
前田 康成 後藤 文太朗 升井 洋志 桝井 文人 鈴木 正清 松嶋 敏泰 
誌名:   電子情報通信学会論文誌 A
発行日: 2013/08/01
Vol. J96-A  No. 8 ; pp. 572-581
論文種別:  特集論文 (電子情報通信分野における萌芽的研究論文小特集)
専門分野: 人工知能
キーワード: 
ロールプレイングゲームノンプレイヤキャラクタマルコフ決定過程統計的決定理論ベイズ基準
 あらまし | 本文:PDF(735.5KB)

収益を考慮した保全への状態が未知のマルコフ決定過程の適用
前田 康成 後藤 文太朗 升井 洋志 桝井 文人 鈴木 正清 
誌名:   電子情報通信学会論文誌 D
発行日: 2012/09/01
Vol. J95-D  No. 9 ; pp. 1802-1805
論文種別:  レター
専門分野: 
キーワード: 
保全マルコフ決定過程未知状態統計的決定理論ベイズ基準
 あらまし | 本文:PDF(197KB)

マルコフ決定過程の動作時間と受信バッファ容量が有限の選択再送ARQへの適用
前田 康成 雨宮 康二 小林 直人 吉田 秀樹 鈴木 正清 松嶋 敏泰 
誌名:   電子情報通信学会論文誌 A
発行日: 2010/08/01
Vol. J93-A  No. 8 ; pp. 572-578
論文種別:  レター
専門分野: 
キーワード: 
選択再送ARQマルコフ決定過程スループット動的計画法
 あらまし | 本文:PDF(233.1KB)

自然方策こう配法:平均報酬の自然こう配に基づく方策探索
森村 哲郎 内部 英治 吉本 潤一郎 銅谷 賢治 
誌名:   電子情報通信学会論文誌 D
発行日: 2008/06/01
Vol. J91-D  No. 6 ; pp. 1515-1527
論文種別:  論文
専門分野: 人工知能,認知科学
キーワード: 
強化学習自然こう配法リーマン計量行列方策こう配法マルコフ決定過程
 あらまし | 本文:PDF(457KB)

マルコフ決定過程によるWebページランキングアルゴリズム
岡村 寛之 宮内 聡 土肥 正 
誌名:   電子情報通信学会論文誌 D
発行日: 2006/02/01
Vol. J89-D  No. 2 ; pp. 210-219
論文種別:  特集論文 (データ工学論文特集)
専門分野: Webマイニング・Web情報検索
キーワード: 
情報検索ランキングアルゴリズムスコアリングPageRankマルコフ決定過程
 あらまし | 本文:PDF(252.9KB)

マクロオペレータの部分的再利用による強化学習システムの動的環境への適応能力の改善
嶋田 総太郎 安西 祐一郎 
誌名:   電子情報通信学会論文誌 D
発行日: 2001/07/01
Vol. J84-D1  No. 7 ; pp. 1076-1088
論文種別:  論文
専門分野: 人工知能,認知科学
キーワード: 
強化学習動的環境マルコフ決定過程マクロオペレータ
 あらまし | 本文:PDF(852.5KB)

改良保全と不完全修理を考慮したマルコフ的劣化モデル
田村 信幸 宮村 鐵夫 
誌名:   電子情報通信学会論文誌 A
発行日: 2001/02/01
Vol. J84-A  No. 2 ; pp. 197-207
論文種別:  論文
専門分野: 信頼性,保全性,安全性
キーワード: 
マルコフ決定過程改良保全不完全修理最適政策総期待割引コスト
 あらまし | 本文:PDF(255.7KB)

複数修理保全モデルにおける最適保全方策に関する一考察
高橋 將人 鈴木 和幸 
誌名:   電子情報通信学会論文誌 A
発行日: 1997/04/25
Vol. J80-A  No. 4 ; pp. 677-683
論文種別:  論文
専門分野: 信頼性,保全性
キーワード: 
状態監視保全最適方策TP2モニタリングマルコフ決定過程
 あらまし | 本文:PDF(406.4KB)

マルコフ決定過程の分散学習制御
原 元司 阿部 健一 
誌名:   電子情報通信学会論文誌 D
発行日: 1997/01/25
Vol. J80-D2  No. 1 ; pp. 363-366
論文種別:  レター
専門分野: 
キーワード: 
マルコフ決定過程学習制御学習オートマトン分散協調システム
 あらまし | 本文:PDF(248.7KB)