音声認識のための高速最ゆう推定を用いた声道長正規化

江森 正  篠田 浩一  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.11   pp.2108-2117
発行日: 2000/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声情報処理:現状と将来技術論文特集)
専門分野: 現状技術の基礎理論:音声・音響情報処理
キーワード: 
音声認識,  隠れマルコフモデル,  話者正規化,  声道長,  最ゆう推定,  

本文: PDF(419.3KB)>>
論文を購入




あらまし: 
近年,隠れマルコフモデル(HMM)を用いた大語彙音声認識システムにおいて,声道長正規化と呼ばれる話者による声道長の違いを補正する話者正規化の手法が提案されている.本論文では,声道長による特徴量の変化を,ケプストラム空間における声道長パラメータを用いた線形写像で近似し,そのパラメータを発声から最ゆう推定する手法を提案する.従来の複数の声道長パラメータをあらかじめ用意する手法に比べ,計算量が少なく,より話者に最適なパラメータが推定可能である.日本語5000単語認識を用いた評価実験において,本方式単独で,7.1%誤りが減少し,また,ケプストラム平均正規化(CMN)と組み合わせた場合に,14.6%誤りが減少した.