ニューラル予測モデルを用いた不特定話者音声認識

磯 健一  渡辺 隆夫  

誌名
電子情報通信学会論文誌 D   Vol.J73-D2   No.8   pp.1315-1321
発行日: 1990/08/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (ニューロコンピューティング論文特集)
専門分野: 音声・信号処理への応用
キーワード: 


本文: PDF(600.3KB)>>
論文を購入




あらまし: 
本論文では,ニューラルネットワークによるパターン予測に基づいた音声認識方式を提案する.本方式では各認識対象クラスごとに多層パーセプトロン(MLP)の列で構成された独立した非線形予測器を用意し,その入出力間で形成される非線形写像によって音声パターンの時間的な構造,特に特徴ベクトル列の時間的な相関構造を表現し,認識に重要な特徴として利用する.他方,話者の違いや発声の揺らぎによる音声パターンの時間構造の変動は動的計画法を利用して正規化する.各予測器を構成するMLPのパラメータを決定する学習アルゴリズムとしては,動的計画法と誤差逆伝搬法を組み合わせた繰返しアルゴリズムを提案し,その収束性を示した.本方式の基本的な動作を調べるために不特定話者の離散数字認識実験を行った結果,少数の学習データからでもパラメータの推定が良好に行われ,高い認識性能が得られることが示された.