差分スナップショットを伴う連携チェックポインティングの提案と評価

大原 衛  新井 雅之  福本 聡  岩崎 一彦  

誌名
電子情報通信学会論文誌 A   Vol.J89-A   No.5   pp.360-373
発行日: 2006/05/01
Online ISSN: 1881-0195
DOI: 
Print ISSN: 0913-5707
論文種別: 論文
専門分野: コンカレント工学
キーワード: 
分散システム,  連携チェックポインティング,  差分スナップショット,  信頼性,  確率モデル,  

本文: PDF(1MB)>>
論文を購入




あらまし: 
連携チェックポインティング手法は,プロセス間協調によって必ず無矛盾な大域状態を保存する.そのため,一時的にアプリケーションメッセージの交換を停止する必要があるが,障害回復時のロールバックの手順を単純化でき,リカバリコストは小さい.通信コストが大幅に低減された現在,連携手法はその重要性を増しているといえる.しかし大規模システムでは,メッセージ交換の頻繁な停止によって性能が大きく損なわれるおそれがある.本研究では,定期的に訪れるチェックポイント生成機会の一部で連携を行い,残る機会には各プロセスが独自に差分スナップショットを生成する手法を提案する.この手法は,連携による性能低下の軽減を図るとともに,比較的高速なリカバリの実現を目指す.その有効性の評価では,チェックポインティングオーバヘッド及びリカバリコストを確率モデルとシミュレーションによって見積もり,従来の連携手法と比較する.その結果,提案手法は,メッセージ頻度の比較的低い環境において,性能及び信頼性の観点から従来の連携手法よりも効果的であることを示す.また,スナップショットに関する二つの差分方式について比較し,それぞれに適した環境について考察する.