K-L変換に基づく話者適応と高速辞書照合を用いた大語い単語音声認識

松浦 博  新田 恒雄  

誌名
電子情報通信学会論文誌 D   Vol.J72-D2   No.8   pp.1256-1263
発行日: 1989/08/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (新しい音声処理技術特集)
専門分野: 音声認識・単語音声認識
キーワード: 


本文: PDF(651.6KB)>>
論文を購入




あらまし: 
単語を構成する単音節を認識し,その結果得られる音節ラティスと単語辞書とを照合することにより,数千語の大語い単語を高い精度でかつ高速に認識するシステムを開発した.単音節の認識方法は複合類似度法を採用し,システム上で話者適応を行った.話者への適応は,あらかじめ不特定多数の話者から作成した相関行列を更新することにより行い,この相関行列を専用ハードウェアで高速K-L変換することにより,各話者の直交化辞書セットを得ている.また,音節セグメンテーション時の脱落・挿入に効果的に対処し,しかも高速処理が可能な辞書照合方式と,日本語の単語音声中で生じることの多い音節脱落に対処した単語辞書を構成する方法を提案した.更に,本システムを用いて10名の男女成人話者に対し,話者適応および駅名200語(単語辞書2,000語)の認識実験を行い,5位までの単語認識率で平均97.6%を得た.