飼いならし学習問題における不採用訓練事例の再活用手法

小石 泰毅  石田 秀一  田原 竜夫  宮本 弘之  

誌名
電子情報通信学会論文誌 D   Vol.J100-D   No.11   pp.917-925
発行日: 2017/11/01
Online ISSN: 1881-0225
論文種別: 論文
専門分野: 人工知能,データマイニング
キーワード: 
飼いならし学習問題,  アンサンブル学習,  二値分類,  BaggTaming,  

本文: PDF(806.3KB)
>>論文を購入


あらまし: 
2種類の訓練事例集合を扱う学習問題として,信頼性の高いラベルをもつ少量の飼育データと,信頼性の低いラベルをもつ大量の野生データを相互補完する飼いならし学習問題が提案されている.飼いならし学習問題の解法の一つであるBaggTamingの目標は,学習したい目標概念を良好に表すことができる学習器を選択的に使用し,飼育データのみから学習した場合よりも高い学習精度をもたせることである.このとき,目標概念と異なる分布から生成された訓練事例は学習に有効に利用されず,不採用となる.一方で,不採用訓練事例に目標概念と一致するラベルを与えることができれば,飼いならし学習で使用する訓練事例数は増加し,学習精度の向上が期待できる.本論文では,不採用訓練事例に新たなラベルを与え,再度学習することで,BaggTamingの正判別率向上を図る手法を提案し,意図的に誤ラベルデータを混入したデータセットを用いた実験によってその効果を確認した.実験結果から,提案手法を用いることでより多くの野生データを学習に活用でき,飼育データに対する正判別率の向上を確認できた.