SMQ/HMM方式に基づく不特定話者大語い単語認識

松浦 博  新田 恒雄  

誌名
電子情報通信学会論文誌 D   Vol.J76-D2   No.12   pp.2486-2494
発行日: 1993/12/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 
不特定話者認識,  大語い単語認識,  音声セグメント,  HMM,  SMQ/HMM方式,  K-best等化学習,  

本文: PDF(634.9KB)>>
論文を購入




あらまし: 
本論文では,SMQ/HMM方式に基づく不特定話者大語い単語認識について述べる.この方式は,直交化音声セグメント符号帳を使用した統計的マトリクス量子化(SMQ)と,単語単位の隠れマルコフモデル(HMM)の2段の処理を通して,話者変動と発話変動を効果的に吸収する.SMQでは,音声事象を690種の音声セグメントからとらえ,セグメント内の微小な変動を直交化符号帳の中に表現する.他方HMMでは,より大きな時間軸の変動を単語モデルの中で吸収することを意図している.HMMの学習にはK-best等化学習を用いる.この学習法は,音声セグメントラティス中の上位K個のコード列をモデル推定の際に等しく扱う.本方式は,1,000語の不特定話者大語い単語認識において,96.3%(上位3位内では99.2%)の高い性能を示した.同時に,請い数を227から1,000まで変えた実験では,誤り率の変動が最大0.5%の値に収まり,語い数の増加に対しで性能劣化が非常に少ないことが確認できた.