音声認識のためのスペクトル内挿を用いた話者適応化

篠田 浩一  磯 健一  渡辺 隆夫  

誌名
電子情報通信学会論文誌 A   Vol.J77-A   No.2   pp.120-127
発行日: 1994/02/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 特集論文 (不特定話者音声認識論文特集)
専門分野: 話者適応
キーワード: 
話者適応化,  不特定話者認識,  HMM,  スペクトル内挿,  語い依存性,  

本文: PDF(598.2KB)>>
論文を購入




あらまし: 
連続分布型HMMに基づく音声認識のための教師あり話者適応化の手法を提案する.使用者の負担を軽くするために適応化用単語の発声数を少なくすると,その中に現れない半音節(認識単位)の割合が増える.本手法では,適応化用データに含まれる半音節のHMMパラメータを補正した後で,適応化用データには含まれていない半音節のHMMパラメータをパラメータ空間における内挿(スペクトル内挿)により補正する.更に,適応化用データセットに依存した偏ったパラメータが推定されるのを避けるため,多数話者の多数発声データに基づく補正を行う.5,000単語大語い音声認識をシミュレートした類似100単語認識実験を行い,提案手法を評価した.不特定話者HMMによる認識率81.2%のところ,50単語を適応化に用いたとき,85.2%まで認識率が上昇し,本手法の有効性が確かめられた.