2段階クラスタリングに基づく選択学習による音響モデル適応化

佐藤 庄衛  世木 寛之  尾上 和穂  宮坂 栄一  磯野 春雄  今井 亨  安藤 彰男  

誌名
電子情報通信学会論文誌 D   Vol.J85-D2   No.2   pp.174-183
発行日: 2002/02/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  クラスタリング,  適応音響モデル,  GMM,  ニュース番組,  

本文: PDF(869.4KB)>>
論文を購入




あらまし: 
話者及び発話環境を特定できない音声認識システムでは,音響モデルの学習データと入力音声の不整合による認識精度の低下が問題になる.この問題は話者適応化によって解決が図られるのが通常であるが,話者適法化は,良質な適応化データを入手できないと十分な精度が達成できない.本論文では,小規模なデータから作成したクラスタモデルのゆう度を基準にして,大規模なデータを効率的にクラスタリングすることにより,精度の高い適応音響モデルを得る方法を提案する.また,認識時には,クラスタモデルを用いて,入力音声の文頭部分のみから適応音響モデルを自動的に決定する方法を提案する.提案手法をニュース音声の認識実験に適用した結果,入力音声の文頭の0.5秒間のデータだけでも適応音響モデルの選択精度を確保でき,クラスタごとの適応音響モデルを用いない場合に比べて,誤認識削減率20%が得られ,認識所要時間が23%削減されることが示された.