音素片ネットワークによる音声の音響的変動の記述と単語認識実験

速水 悟  田中 和世  太田 耕三  

誌名
電子情報通信学会論文誌 D   Vol.J71-D   No.2   pp.265-273
発行日: 1988/02/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5713
論文種別: 論文
専門分野: 音声処理
キーワード: 


本文: PDF(813.5KB)>>
論文を購入




あらまし: 
環境による音声の音響的特性の変動を,記号レベルとパラメータレベルの2段階で記述する方式を提案し,単語認識実験によりその有効性を検討した.記号レベルの変動記述は,大量の音声データの観察に基づきトップダウン的に決定されたカテゴリーである音素片および規則による.規則には書換規則・変形規則があり,これらの規則によって音素列から音素片ネットワークが自動的に生成される.またパラメータレベルの変動記述とは,各音素片ラベルについて音響的特徴パラメータに基づきボトムアップ的に決定されたクラスターを用いた,より精細かつ機械的な記述である.認識システムにはこのほか,音素片ネットワークと入力音声とのマッチングによる直接対応付け,メルケプストラムを時間方向に並べた3個の行列(音素片の始端,中央,終端)による音素片の表現などの特徴がある.不特定話者単語音声認識実験により,(1)単語全体を用いるマルチテンプレート方式との比較,(2)標準パターン数と単語認識率の関係,(3)音韻バランス単語セットへの適用,の3項目について検討した.単語認識率は,53都市名99.4%,492単語(音韻バランス単語セットWD-I)96.0%などが得られ,本方式の有効性が示された.