話者空間モデルに基づいた音素間相関を用いた音声認識

趙 國  一丸 太一郎  山下 洋一  

誌名
電子情報通信学会論文誌 D   Vol.J87-D2   No.7   pp.1402-1408
発行日: 2004/07/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音素間相関,  主成分分析,  話者空間,  母音の正規化,  

本文: PDF(482.9KB)>>
論文を購入




あらまし: 
音声認識では,話者の違いによる音響スペクトルの多様性に対応した音響的ゆう度の算出手法が必要となる.音素の音響的特徴は話者の違いにより広い範囲に変動するが,音素間の相対的な関係には話者によらず強い依存性があることが知られている.本論文では,不特定話者音声認識において音素間の相関を考慮することにより,適応データを用いることなく話者の特徴を利用する認識手法を提案する.多数話者による日本語5母音の物理的特徴の広がりを,主成分分析によって次元を圧縮することにより,ある話者の5母音が存在し得る特徴部分空間(話者空間)を構成しモデル化する.音声認識での文仮説候補における5母音からなる特徴を特徴ベクトル空間上に配置し話者空間までの距離を求め文仮説の妥当性とする.N-bestの各候補の音響スコアに話者空間までの距離を付け加え再評価し,25%の認識誤り削減率を得た.