動的環境におけるマルチエージェント巡回清掃の自律的な戦略学習の提案

杉山 歩未  菅原 俊治  

誌名
電子情報通信学会論文誌 D   Vol.J98-D   No.6   pp.862-872
発行日: 2015/06/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2014SWP0023
論文種別: 特集論文 (ソフトウェアエージェントとその応用論文特集)
専門分野: エージェントベースシミュレーション
キーワード: 
マルチエージェントシステム,  協調巡回清掃,  学習,  忘却,  自律的エージェント,  

本文: PDF(2.8MB)>>
論文を購入




あらまし: 
本研究ではマルチエージェント協調巡回清掃において環境の各場所の汚れやすさを学習し,その情報に基づく適切な巡回戦略を自律的に学習する手法と,環境変化を自律的に検出して迅速に戦略を変更する手法を提案する.近年の計算機とロボット技術の発展は,ロボットの応用範囲を急速に拡大し,協調しながら高度な作業を広大な環境で行うことが期待されている.しかし,適切な行動戦略はその環境の特性やロボットの制御ソフトウェアであるエージェントの能力,他のエージェントの行動戦略などに依存し,更に変化の可能性もあり自明ではない.本研究では,巡回清掃問題を題材に,汚れやすさの情報を実際の清掃からセンサー情報として獲得し,各所の汚れやすさを学習しながら,その環境に合った行動戦略を学習する手法を提案する.更に環境の変化に対し,過去の学習情報の影響を防ぎ迅速に追随できるように,その変化を自律的に検出し,既存の学習情報を一部忘却する適応法を導入する.評価実験の結果,汚れやすさを既知とした場合と同等か,環境によってはその効率を超えることが観測され,その理由について考察する.また,環境の変化に対しても,提案手法が速やかな変化を促すことを示す.