多数話者単語音声認識における母音の特徴を利用した入力音声正規化

大野 澄雄  広瀬 啓吉  藤崎 博也  

誌名
電子情報通信学会論文誌 A   Vol.J76-A   No.12   pp.1661-1667
発行日: 1993/12/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 論文
専門分野: 音声
キーワード: 
話者適応,  音声正規化,  マルチテンプレート法,  DP照合法,  次元圧縮,  

本文: PDF(507.2KB)>>
論文を購入




あらまし: 
多数話者に対応する音声認識において,入力音声正規化法とマルチテンプレート照合法は話者によるばらつきに対処する有効な二つの手法である.本論文では,対象とする話者の孤立に発声した5母音のみを利用して求められる線形変換を音響的特徴に対して施すことによる,話者性に関する入力音声正規化手法を提案する.この正規化手法とマルチテンプレートDP照合法を組み合わせた単語音声認識実験を行ったところ,認識率において改善が見られ,特に単語当りのテンプレート数が少ない場合に大きく認識率が向上することを確認した.また認識精度だけでなく,提案手法に基づく正規化パラメータは次元数が4に削減されており,単語音声認識全体の効率を高める上で有効なものと言える.