半音節を単位としたHMMを用いた大語い音声認識

渡辺 隆夫  吉田 和永  古賀 真二  

誌名
電子情報通信学会論文誌 D   Vol.J72-D2   No.8   pp.1264-1269
発行日: 1989/08/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (新しい音声処理技術特集)
専門分野: 音声認識・単語音声認識
キーワード: 


本文: PDF(544.3KB)>>
論文を購入




あらまし: 
比較的小規模の学習データからの学習が可能な,大語い向きの特定話者の音声認識方式として,半音節を単位としたHMMによる方法を述べる.発声変動に効率的に対処するため,推定すべきモデルに,音声の知見に基づく構造を導入している.比較的少ない種類で音素間の調音結合を扱える認識単位として,半音節単位を採用している.HMMの出力確率を,単純なスカラ分散をもつ単一ガウス分布で表現すると共に,音声の知見に基づき,大きな発声変形を記述するため半音節の変形モデルを導入している.実験により,学習サンプルに対する視察による半音節セグメンテーションや発声変形の判定なしに,基準話者のモデルを初期値とした自動学習が可能であることを示した.音素バランスのとれた250単語学習による500単語および1800単語認識実験の結果,良好な認識率(99.0%および97.5%)を得,方式の有効性を確認した.