クラスに依存した語彙の確率的記述に基づく階層型言語モデル

谷垣 宏一  山本 博史  匂坂 芳典  

誌名
電子情報通信学会論文誌 D   Vol.J84-D2   No.11   pp.2371-2378
発行日: 2001/11/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
未登録語,  未知語,  音声認識,  統計的言語モデル,  音韻連鎖,  

本文: PDF(424.8KB)>>
論文を購入




あらまし: 
本論文では,連続音声認識における未登録語の問題に対処するための,新しい言語モデルを提案する.本言語モデルは,未登録語を認識するために,単語クラスに依存した音韻連鎖のモデル「クラス内語彙モデル」を用いる点を特徴とする.未登録語の認識結果としては,単語の読みとクラスが得られるため,後段の言語処理に対して有用な単語属性情報を与えることが可能となっている.本方式を日本人姓・名の未登録語に適用し評価を行った.姓・名のクラス内語彙モデルは,単語長のガンマ分布と,自動獲得したサブワード単位のN-gramを用いて構成した.音声認識実験の結果,登録語として認識した場合と同等の精度で,未登録語の区間・読み・クラスを同定できることを確認した.