集団能動学習―データマイニング・バイオインフォマティックスへの展開―

馬見塚 拓  安倍 直樹  

誌名
電子情報通信学会論文誌 D   Vol.J85-D2   No.5   pp.717-724
発行日: 2002/05/01
Online ISSN: 
Print ISSN: 0915-1923
論文種別: 招待論文 (情報論的学習理論論文小特集)
専門分野: 
キーワード: 
能動学習,  Bagging,  Boosting,  データマイニング,  実験計画,  

本文: PDF(698.8KB)
>>論文を購入


あらまし: 
本論文では,筆者らが提案して来た,能動学習と精度増強手法Bagging/Boostingを組み合わせた,Active Ensemble Learningともいえる一連の新しい学習手法群について解説する.これらの手法群は,いずれも,データ空間あるいはデータベースから,少量かつ情報量の大きいデータを繰り返し選択(質問)することにより,非常に高精度な学習を実現する.本論文では,特に,手法の技術的な側面のみならず,免疫学における生化学/分子生物学実験に対する能動的な実験計画やCRM (Customer Relationship Management)における大規模データからの顧客セグメンテーションという二つの現実の問題への適用結果において,これらの手法群がいずれも従来手法を凌駕する高いデータ効率性や予測精度を挙げることを示す.