モジュール型ニューラルネットによる品詞タグ付け

馬 青  呂 宝糧  井佐原 均  市川 道教  

誌名
電子情報通信学会論文誌 D   Vol.J84-D2   No.4   pp.708-717
発行日: 2001/04/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
品詞タグ付け,  タイ語コーパス,  モジュール型ニューラルネット,  並列学習,  過学習,  

本文: PDF(439.9KB)>>
論文を購入




あらまし: 
ニューラルネットを用いた品詞タグ付けシステムは既に馬らにより提案されてきた.システムは,数万オーダの多品詞語をもつ小規模タイ語コーパスを用いて学習することによって,品詞タグ付けの主要手法とされてきた隠れマルコフモデルよりはるかに高い精度で未学習データをタグ付けすることができた.しかしながら,用いた3層パーセプトロンはその収束性の問題から,このような小規模データの学習においても収束が遅く学習精度が低かった.そのため,学習回数や学習データを増やしても,それ以上精度向上を図るのは難しい.本研究では,この問題を解決するために,品詞タグ付けシステムに,呂らが提案したモジュール型ニューラルネットを用いた.新しいシステムは,複雑かつ大規模な品詞タグ付け問題を複数のより簡単で小規模な問題に分割して解くため,収束性の問題がなく,品詞タグ付け問題をより速くより高精度で学習することができた.その結果,同じ学習データを用いながら学習精度を上げること,更にはより大規模なデータを用いて学習することが可能となり,品詞タグ付けの更なる精度向上が可能となった.