日本文音節入力に対して2重マルコフ連鎖モデルを用いた漢字仮名交じり文節候補の抽出精度

村上 仁一  荒木 哲郎  池原 悟  

誌名
電子情報通信学会論文誌 D   Vol.J75-D2   No.1   pp.11-20
発行日: 1992/01/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 
音声認識,  言語処理,  2重マルコフ連鎖モデル,  漢字仮名,  

本文: PDF(609.3KB)>>
論文を購入




あらまし: 
文節単位の音節マトリクス形式で入力された日本語音節認識候補から漢字仮名交じりの日本語文節候補を生成する処理において,従来の音節の2重マルコフモデルによる音節文節候補の選択に加えて,漢字仮名の2重マルコフモデルを適用して文節の絞込み効果を二つの方法で,実験的に明らかにした.第1の方法(音節選出型文節処理方式)では,はじめに文節単位の音節マトリクスに音節の2重マルコフモデルを適用して8位までの音節の文節候補を得る.次に16万語の単語辞書を参照して単語候補に変換する.最後に,漢字仮名の2重マルコフモデルを適用して,漢字仮名交じりの文節候補を生成する.第2の方法(直接選出型文節処理方式)では,はじめに同音節マトリクスから同単語辞書を用いて直接,単語候補を抽出する.次に,漢字仮名の2重マルコフモデルを適用して漢字仮名交じりの文節候補を生成する.それぞれの方法における正解率を求めた結果,文節候補の生成において,漢字仮名の2重マルコフモデルの効果は顕著で,第1位の正解率は第1,第2の方法でオープンデータにおいて,それぞれ65%,70%,クローズドデータにおいて,それぞれ83,84%となり,高い精度の漢字仮名交じりの文節候補が得られることがわかった.