言語資源の用途情報の獲得と利用

小澤 俊介  遠山 仁美  内元 清貴  松原 茂樹  

誌名
電子情報通信学会論文誌 A   Vol.J95-A   No.7   pp.611-622
発行日: 2012/07/01
Online ISSN: 1881-0195
DOI: 
Print ISSN: 0913-5707
論文種別: 特集論文 (電子情報通信分野における萌芽的研究論文小特集)
専門分野: 人工知能
キーワード: 
情報抽出,  言語資源,  情報検索,  メタデータ,  構文解析,  

本文: PDF(553.1KB)
>>論文を購入


あらまし: 
言語研究では,コーパスや辞書を用いた研究が盛んであり,数多くの言語資源が作成されてきた.言語資源は,その作成に多大な労力を要するため,多くの利用者によって共有され利用されることが望ましい.しかし,現存する言語資源が十分に活用されているとは言いがたい.その理由として,利用目的に合致した言語資源を広範に探すことが難しい点が挙げられる.本論文では,言語資源の効果的な利用の促進には,用途をキーに言語資源を検索できること,またその際,経験者の経験から生み出された用途も重要になるという認識に基づき,経験者が記したテキストから言語資源の用途情報を自動獲得する手法を示し,獲得した用途情報の妥当性と有用性を評価する.用途情報は,構文構造を考慮した抽出ルールを作成し,ルールを学術論文に適用することにより獲得した.評価の結果,言語資源の経験者が記した用途情報を本手法により精度良く獲得できること,及び,獲得した用途情報が言語資源の検索に有効に機能することを確認した.