話者クラスタリング手法を用いた不特定話者音素HMM作成法

小坂 哲夫  松永 昭一  倉岡 幹雄  

誌名
電子情報通信学会論文誌 D   Vol.J79-D2   No.3   pp.313-321
発行日: 1996/03/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
HMM,  Baum-Welchアルゴリズム,  不特定話者音声認識,  HMnet,  クラスタリング,  

本文: PDF(685.3KB)>>
論文を購入




あらまし: 
HMMの学習のためのBaum-Welchでは,学習話者数を変更したり新たなデータを追加する場合は,最初から学習をやり直す必要があった.大規模な不特定話者HMMを変更する場合,計算時間の点で大きな問題となっていた.そこで本論文では,不特定話者のHMMを作成する場合,話者の情報を考慮に入れたモデリングにより,以上の問題点を解決する方法を提案する.具体的には,特定話者のHMMをクラスタリングして合成することにより,パラメータの再推定なしに不特定話者HMMを作成する方法を提案する.更に不特定話者音素HMM作成における,話者の種類と話者数についての検討を行った.以上について不特定話者音声認識実験により評価した.その結果,本手法では従来法のBaum-Welchアルゴリズムと比較して,性能の低下なしにモデル作成時の計算量を約1/20~1/60に削減できることがわかった.更に,特定話者HMMが用意されていれば,話者15人の場合1分程度で不特定話者HMMが作成でき,簡便にモデルに話者の追加・変更が可能であることがわかった.また話者の種類を検討した結果,不特定話者HMMを作成する場合,クラスタリングにより話者を選択することが有効であることがわかった.