テキスト情報分析のための判断情報アノテーション

松吉 俊  江口 萌  佐尾 ちとせ  村上 浩司  乾 健太郎  松本 裕治  

誌名
電子情報通信学会論文誌 D   Vol.J93-D   No.6   pp.705-713
発行日: 2010/06/01
Online ISSN: 1881-0225
Print ISSN: 1880-4535
論文種別: 特集論文 (情報爆発論文特集)
専門分野: 自然言語処理,意味解析
キーワード: 
自然言語処理,  情報抽出,  モダリティ解析,  コーパス,  条件付確率場,  

本文: PDF(269.2KB)
>>論文を購入


あらまし: 
ブログに代表される個人型情報発信メディアの爆発的な普及に伴い,膨大なテキスト情報がWeb上に加速度的に蓄積されつつある.これらの情報を目的に合わせてうまく整理し,そこから有益なデータを得るためには,記述される個々の事象に対して,その述語と項構造(だれが何をするのか)を認識するだけではなく,書き手が表明している態度や真偽判断,価値判断などの情報も解析し,総合的に分析を行う必要がある.我々は,書き手の態度や真偽判断などに関する情報を事象のモダリティ情報と呼び,文章に存在する各事象に対して,このモダリティ情報を解析する技術の開発に取り組んでいる.本論文では,事象のモダリティ情報を表す七つ組のタグの体系を提案し,現在構築しているコーパスについて報告する.また,提案するタグ体系に基づく解析システムの実現可能性とその性能に関して議論する.コーパスの対象は約4万の事象であり,タグ付与の作業者間一致度はkappa統計量で0.71という高い値であった.我々が試作した解析システムは,真偽判断タグに関して正解率0.95,F値平均0.68という,自動タグ付与機構の実現可能性を示唆する比較的高い値を示した.