CombNET-IIによる中国語1000単語音声認識

魏 回  北村 正  岩田 彰  鈴村 宣夫  

誌名
電子情報通信学会論文誌 D   Vol.J75-D2   No.4   pp.689-696
発行日: 1992/04/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 
大規模ニューラルネットワーク,  音声認識,  バックプロバケーション,  ベクトル量子化,  メルケプストラム,  

本文: PDF(571.9KB)>>
論文を購入




あらまし: 
多数のカテゴリーを分類する一つの手法として,我々は大規模ニューラルネット(CombNET-II)を提案した.これは,前段に入力ベクトルを大分類するためのベクトル量子化型ニューラルネットを配置し,後段にグループ内のデータを細分類するための階層ニューラルネットを配置した.くし型の構成をしている.本論文では,CombNET-IIを用いる大語いの音声認識手法を提案し,この方法を中国語の単語音声認識に適用し,その有用性について検討する.音声信号から2次元メルケプストラム法によって求められる特徴量をCombNET-IIの入力に用いる.2次元メルケプストラムは音声の静的特徴と動的特徴を同時に分析でき,音声認識には有効なパラメータである.今回の音声認識実験では,特定話者が中国語で発声した世界の国名と都市名1000単語を用いた,各単語を5回ずつ発声し,この中の4回分のデータで学習を行い,残りの1回分のデータを認識させたところ,99.0%の認識率が得られ,本方法の有効性が示された.