係り元文節からの相対的な距離を反映した統計的日本語係り受け解析

山本 悠二  増山 繁  

誌名
電子情報通信学会論文誌 D   Vol.J93-D   No.6   pp.1036-1047
発行日: 2010/06/01
Online ISSN: 1881-0225
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 自然言語処理
キーワード: 
構文解析,  統計的日本語係り受け解析,  優先度学習,  相対的な距離,  

本文: PDF(322.6KB)
>>論文を購入


あらまし: 
本論文では係り元文節からの相対的な距離を反映した統計的日本語係り受け解析手法を提案する.統計的係り受け解析の従来手法では,文節対の係りやすさを訓練データから推定する際に,文節間の距離を1,2~5,6以上といった複数のカテゴリーに分け,推定に用いる素性として与えている.ところが,複数の係り先候補が同一の文節間距離カテゴリーに属するときには距離による弁別ができないため,最ゆうの係り先を定めることが困難になる場合がある.一方,文節候補集合から二つの文節候補を取り出す場合,それぞれの候補は係り元に近いか遠いかを一意に決めることができる.そこで提案モデルでは,文節候補集合から二つの文節候補を繰り返し取り出す際に,それぞれの文節候補に対して係り元に近い/遠いという情報を素性として追加して係りやすさを求めることで,係り先候補文節内の係り元文節からの相対的な距離を反映した係り受け解析を行えるようにする.京都テキストコーパス4.0を用いて実験を行い,ベースライン手法と比べて係り受け正解率,及び,文正解率が有意に改善していることが確認された.