ウェブを利用した専門用語の分野判定

木田 充洋  外池 昌嗣  宇津呂 武仁  佐藤 理史  

誌名
電子情報通信学会論文誌 D   Vol.J89-D   No.11   pp.2470-2482
発行日: 2006/11/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 自然言語処理
キーワード: 
専門用語,  ウェブ,  用語抽出,  分野判定,  

本文: PDF(459.5KB)>>
論文を購入




あらまし: 
本論文では,用語の出現する文書中における分野の割合に基づいて,用語の分野判定を行う手法を提案する.用語の分野判定は,専門用語集の自動生成を行う上で必要な要素技術の一つである.提案手法では,判定対象の用語と,対象分野の既知の専門用語サンプルのみを入力として,ウェブを利用することにより,自動で用語の分野判定を行う.具体的には,判定対象の用語が出現する文書を収集し,これらに対して分野判定を行うことで,用語が一般の文書に比べて専門分野の文書に偏って用いられる度合を測定し,専門用語であるかどうかを判定する.評価実験の結果,7割以上の精度,9割前後の再現率で,用語の分野判定を行うことができることを確認した.また,本論文では,既存の辞書に未登録の用語をウェブから収集し,これに対して提案手法を適用することにより,当該分野の新たな用語が獲得できることを示した.これにより,提案手法が専門用語集の自動生成において有用な技術であることを示した.