グループ木構造グラフを利用した人物キーワードのエンティティリンキング手法

苗村 昌秀  宮崎 勝  浦川 真  藤沢 寛  

誌名
電子情報通信学会論文誌 D   Vol.J100-D   No.9   pp.853-865
発行日: 2017/09/01
Online ISSN: 1881-0225
論文種別: 論文
専門分野: 自然言語処理
キーワード: 
Entity Linking,  Wikipedia,  グラフ処理,  グループ木,  人物キーワード抽出,  字幕,  

本文: PDF(2.1MB)
>>論文を購入


あらまし: 
放送番組の情報を生活空間に活用できる放送通信連携サービスの実現を目指した研究を進めている.番組中からの情報を有効に活用するためには,EPGデータや字幕などから抜き出したキーワードのエンティティを特定するエンティティリンキング技術の確立が重要である.そこで,本論文では,キーワードとして特に利用価値の高い人物キーワードに焦点を当て,番組中の字幕文に登場する人物キーワードをWikipedia見出し語にエンティティリンキングする手法を提案する.提案手法では,Wikipedia記事に出現するキーワード間の関係をマイニングし,エンティティリンキングに利用することを基本としているが,Wikipedia内での人物キーワード間のリンク情報を解析してグループ木構造グラフを生成して,キーワードの曖昧性を軽減する手法を採用しているところが大きな特徴である.提案手法をWikipedia本文中のアンカーリンク部分から作成したデータセットや実番組からの字幕データに適用したところ,従来手法より有意な改善が得られた.