大規模ウェブテキストからの片仮名用言の自動獲得

鍜治 伸裕  福島 健一  喜連川 優  

誌名
電子情報通信学会論文誌 D   Vol.J92-D   No.3   pp.293-300
発行日: 2009/03/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (データ工学論文特集)
専門分野: テキストマイニング
キーワード: 
ウェブ,  自然言語処理,  形態素解析,  

本文: PDF(168.9KB)>>
論文を購入




あらまし: 
テキストマイニングでは,自然言語処理分野の基礎技術である形態素解析がモジュールとして利用されることが多い.しかし,ウェブには口語体のテキストが多く,新聞記事のような整ったテキストを対象としてきた自然言語処理技術では,十分な精度で解析を行うことは難しい.本論文では,形態素解析の精度低下は「ググる」などの片仮名用言が一因となっていることに着目し,それを大規模なウェブテキストから自動獲得する手法を提案する.