Wikipediaの編集履歴から学習したベクトル表現によるコンテンツの人気予測

野中 尚輝  中山 浩太郎  松尾 豊  

誌名
電子情報通信学会論文誌 D   Vol.J101-D   No.4   pp.657-668
発行日: 2018/04/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2017DEP0006
論文種別: 特集論文 (データ工学と情報マネジメント論文特集)
専門分野: Webマイニング
キーワード: 
人気予測,  Wikipedia,  MLP,  ベクトル表現,  

本文: PDF(823.6KB)
>>論文を購入


あらまし: 
コンテンツ産業は,日本の重要な産業の一つであり,近年海外においてもその人気が高まっている.このような背景の中で,コンテンツホルダー及びコンテンツ作品の二次利用を考える企業にとって,コンテンツ作品の人気を予測することは重要な課題である.これまでの人気予測の研究では,消費者の嗜好をもとにしたジャンルや流行した年代といった複数の尺度についての類似度を考慮したコンテンツの多面的な情報が考慮されることは少なかった.本研究では,Wikipediaにおける編集履歴よりユーザの嗜好を抽出し,それに基づくコンテンツ作品の多面的な情報をもつベクトル表現を得ることを試みた.また,学習されたベクトル表現について定性的な分析を行うとともに,人気予測において精度を全体として2〜3%向上させることを示した.更に獲得されたベクトル表現をクラスタリングすることで,予測精度が20%程度向上するクラスタが存在することを示し,精度が向上する要因について分析を行った.