接続の方向性を考慮した多重クラス複合N-gram言語モデル

山本 博史  匂坂 芳典  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.11   pp.2146-2151
発行日: 2000/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声情報処理:現状と将来技術論文特集)
専門分野: 現状技術の基礎理論:音声認識・理解・対話
キーワード: 
クラスN-gram,  可変長N-gram,  自動クラス分類,  連鎖語,  

本文: PDF(310.7KB)>>
論文を購入




あらまし: 
効率的な単語のクラス化に基づく,コンパクトで信頼姓の高い音声認識のための言語モデルを生成する手法を提案する.本手法では直前及び,直後の単語への接続性を別の属性としてとらえ,各単語に対してその属性ごとに別々のクラス化を行う.これによって得られる多重の単語クラスは前後に接続している単語の分布に基づいて各々独立に作成されるため,効率的でかつ信頼性の高いクラス分類となっている.提案手法を連鎖語の導入による可変長N-gramに適用した多重クラス複合N-gramにおいては,10分の1のエントリサイズで,従来の品詞及び可変長単語列の複合N-gramを上回る単語認識率を示した.