話者認識のシミュレーションにおける話者内変動モデルの精密化

野田 秀樹  

誌名
電子情報通信学会論文誌 A   Vol.J73-A   No.4   pp.709-716
発行日: 1990/04/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 論文
専門分野: 音声
キーワード: 


本文: PDF(761.8KB)>>
論文を購入




あらまし: 
法科学分野等の話者認識では,判定基準(話者照合における判別のしきい値)や推定正答率を事前実験によって求めておく必要がある.しかし,音声資料の時期差や使用できるサンプル数等の認識条件は事件ごとにさまざまであり,これらすべての場合に対処できるようなデータベースを準備することは不可能に近い.この問題に対処するためには,シミュレーションによる推定が現実的であるが,従来のシミュレーション技法では十分な推定精度は得られない.本論文はその向上を目的として,話者内変動モデルを精密化した人工特徴ベクトルの作成法を提案する.本方法は,(1)話者内変動を時期的変動と同時期内変動とに分離し,(2)特徴ベクトルの話者内,および話者間共分散行列の非対角成分も考慮し,更に,(3)話者内共分散行列に話者依存性をもたせた点に特徴がある.5母音を用いた話者認識実験によって,本方法が実音声の場合をよく模擬できることを確認した.特に,話者照合におけるシミュレーションの精度は非常に良く,シミュレーションと実音声との話者照合率の差は,5母音の平均でわずかに0.7%程度であった.