任意発声データに対する発音記号列を用いた離散分布HMMの話者適応化法

今井 亨  安藤 彰男  宮坂 栄一  

誌名
電子情報通信学会論文誌 D   Vol.J78-D2    No.11    pp.1563-1571
発行日: 1995/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
話者適応化,  HMM(隠れマルコフモデル),  コードブック,  Λ学習法,  

本文: PDF(669.6KB)>>
論文を購入



あらまし: 
本論文では,コードブックと離散分布HMMを話者適応化する新しい手法を提案する.この手法には次の特徴がある.(1)特定の内容の発声データではなく,任意の発声データとその発音記号列を用いて話者適応化を行う.(2)コードブック適応化の際,各学習データが影響を及ぼすべきコードベクトルを選択し,局所的な修正を繰り返し行う.(3)離散分布HMM適応化の際,Viterbiアルゴリズムにより適応化用学習データの音素境界を決定し,先に提案したΛ学習法によりHMMの学習を行う.Λ学習法は,学習データ数の少ないカテゴリーの存在をも考慮に入れた学習法である.50単語の学習データで男性話者間の適応化を行い,23音素の認識実験を行ったところ,提案する適応化法が,従来の階層的クラスタ化によるコードブック適応化と誤り訂正学習法によるHMM適応化を併用した場合よりも,有効であることが実験的に示された.