時系列テキストを用いた恒久性と一意性に基づく関係の分類

高久 陽平  吉永 直樹  鍜治 伸裕  豊田 正史  喜連川 優  
(学生論文特集秀逸論文)

誌名
電子情報通信学会論文誌 D   Vol.J96-D   No.3   pp.411-422
発行日: 2013/03/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (学生論文特集)
専門分野: 自然言語処理
キーワード: 
関係抽出,  情報抽出,  自然言語処理,  

本文: FreePDF(1009.8KB)


あらまし: 
ウェブに存在する膨大な量のテキストを知識源として,固有表現間の関係知識を獲得する研究が盛んに行われている.しかしながら,現実世界は刻一刻と変化しているため,テキストに含まれる関係知識の中には,現在では既に成り立たない(現在成立していても将来的に成り立たなくなる)関係が存在する.そのため,テキストから得られた関係を整合性のとれた知識として集積する際に問題が生じる.このような問題を解決するために,本研究では恒久性と一意性に基づく関係の分類を提案する.我々は,大規模時系列テキストから得られる時系列頻度情報と言語情報に基づく素性を導出し,機械学習の分類問題として各分類問題を定式化する.提案手法を用いて実験を行った結果,時系列頻度情報が恒久性の分類において再現率,一意性の分類において精度の向上にそれぞれ有効であることを確認した.