品詞接続特性と単語接続特性の最大事後確率推定による融合に基づく単語クラス分類

山本 博史  匂坂 芳典  

誌名
電子情報通信学会論文誌 D   Vol.J84-D2   No.1   pp.41-47
発行日: 2001/01/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
MAP推定,  クラスN-gram,  品詞クラス,  自動クラス分類,  

本文: PDF(204.9KB)>>
論文を購入




あらまし: 
本論文ではコンパクトなモデルサイズでありながら,次単語予測精度,スパースデータに対する信頼性,タスクのずれに対する頑健さを兼ね備えた言語モデルを提案する.このモデルではMAP推定により単語と品詞情報を連続的に補間した新しい単語特徴量に基づいて単語のクラス分類が行われる.このモデルは単語N-gramに対して50%モデルサイズを縮小しておりながら,単語N-gramに比べパープレキシティにおいては訓練セットと同一タスクでは3%,異なるタスクでは15%低く,更に連続単語認識の結果においては,それぞれ16%,及び28%単語誤認識率が低くなっている.