複数のマルコフモデルを用いた階層化言語モデルによる未登録語認識

山本 博史  小窪 浩明  菊井 玄一郎  小川 良彦  匂坂 芳典  

誌名
電子情報通信学会論文誌 D   Vol.J87-D2   No.12   pp.2104-2111
発行日: 2004/12/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
未登録,  階層化言語モデル,  マルコフモデル,  N-gram,  

本文: PDF(397.1KB)>>
論文を購入




あらまし: 
本論文では,タスクに依存して生じる未登録語の問題を解決するための言語モデルを提案する.新規のタスクに言語モデルを対応させる手法としては,言語モデル適応が一般的であるが,この手法では,タスクに依存して現れる固有名詞等の未登録語の問題には対応できない.本論文ではこの問題に対し,階層化言語モデルを用いて解決する.階層化モデルでは,単語間遷移確率と未登録語の音韻列生起確率を与える制約として,独立した二つのマルコフモデルを用いており,未登録語の生起確率は両者を組み合わせた二重マルコフモデルの形で表現される.アポイントメントを目的とした日本語音声対話データを用いた音声認識実験を行った.この結果,一つ以上の未登録語を含む文に対し,未登録語に対する対策を施さなかった場合の単語正解精度78.2%に対し単語正解精度86.7%が得られ,認識誤りのうちの34.4%が救済され,有効性が確認できた.