音節継続時間予測法を用いた不特定話者連続音声認識

滝沢 由実  坪香 英一  

誌名
電子情報通信学会論文誌 A   Vol.J77-A    No.2    pp.173-181
発行日: 1994/02/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 特集論文 (不特定話者音声認識論文特集)
専門分野: 音響モデル
キーワード: 
連続音声認識,  音節継続時間予測,  音節マッチング区間長,  予測誤差,  

本文: PDF(656.8KB)>>
論文を購入



あらまし: 
HMMを用いた音声認識システムにおいて,状態または単語ごとに継続時間を制御する方法が提案されており,その有効性も確認されている.しかし,従来提案されている方法は,状態または単語ごとの継続時間を単独に制御する方法であり,一つの文章内の単語間,あるいは一つの単語,音節,音韻内の状態間の継続時間の相互関係を考慮した制御法ではない.本論文では,日本語音節を認識単位とした音声認識システムにおいて,音節継続時間を制御する方法を提案する.本提案は,一つの文章内の音節継続時間の相互関係を用いて,音節継続時間を制御する方法であり,従来法にない次の2点の効果が期待できる.(1)一つの文章内の音節マッチング区間長が不自然にばらつかない.(2)発声速度に無関係に,継続時間を制御できる.本方法は,まず,既にスポッティングされた音節マッチング区間長と音節継続時間を左右する要因とを用いて,次にスポッティングする音節の継続時間を予測し,次に,予測された継続時間を用いて,マッチング区間の範囲を制御するものである.50文章,10話者を用いた認識実験の結果,本継続時間制御法を用いることで文認識率が約67.2%から71.1%に向上した.