統計的決定理論に基づく既存名詞シソーラスへの未知語登録方法に関する一考察

前田 康成  

誌名
電子情報通信学会論文誌 A   Vol.J83-A   No.6   pp.702-710
発行日: 2000/06/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 特集論文 (情報論的学習理論論文小特集)
専門分野: 画像処理・理解,自然言語処理,符号化への応用
キーワード: 
シソーラス,  未知語,  統計的決定理論,  ベイズ基準,  誤り率,  

本文: PDF(663.9KB)>>
論文を購入




あらまし: 
近年,人工知能の自然言語処理の分野において数多くのシソーラスが構築され,情報検索や機械翻訳などに利用されている.これらの既存シソーラスに対しては未登録の単語(未知語)を新たに登録する必要がある.しかし,従来の未知語登録方法は理論的には何の保証もない.そこで,本研究では統計的決定理論に基づいて未知語登録問題を考え直し,未知語を既存シソーラスの間違ったノードに登録してしまう確率である誤り率をベイズ基準のもとで最小化する未知語登録方法を提案する.更に,実際に既存シソーラスを用いた未知語登録実験を行い,実問題において提案方法が従来方法よりもより多くの未知語を既存シソーラスの正しいノードに登録できることを示す.