フェノニックマルコフモデルに基づく音声認識のための話者適応化法

西村 雅史  

誌名
電子情報通信学会論文誌 D   Vol.J73-D2   No.10   pp.1630-1638
発行日: 1990/10/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 


本文: PDF(816.1KB)>>
論文を購入




あらまし: 
本論文では,離散型のHMM,特に,フレーム単位のモデルであるフェノニックマルコフモデルに基づく音声認識のための話者適応化方法を提案する.この方法は,大きく分けてベクトル量子化コードブックの適応化部と,マルコフモデルの適応化部の二つの部分から構成されている.前者は,学習用音声と,適応化の基準となる単語ベースフォームを,それぞれ時間軸上でN等分割したときの特徴量分布の差に着目した手法を用い,一方後者は,量子化された学習用音声と,単語ベースフォームとの対応関係から推定される線形写像に基づいた手法を用いている.ここでは,類似性の高い150単語を対象とした認識実験を行った.男性1名が全対象語いを10回発声した音声から,適応化の基準となるコードブックとモデルを推定した後で,男性7名,女性4名に対して対象語い中の25単語1回の発声で適応化学習を行ったところ,未学習時に男女それぞれに対し,25.0%,45.2%であった誤認識率が,4.1%,7.8%にまで減少し,本方法の有効性が確かめられた.