雑音下の連続音声中からのキーワード検出

金澤 博史  坪井 宏之  竹林 洋一  

誌名
電子情報通信学会論文誌 D   Vol.J76-D2   No.3   pp.427-435
発行日: 1993/03/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 
音声認識,  キーワード検出,  学習,  雑音環境,  事後確率,  

本文: PDF(649.2KB)>>
論文を購入




あらまし: 
実雑音下での連続音声中からのキーワード検出について述べる.背景雑音を伴う孤立単語音声認識のロバスト性向上に有効であった複合類似度をベースとしたワードスポッティングにおける雑音免疫学習を,不用意に発話された不要語を伴う雑音下の単語音声,更には雑音下の連続音声に対応できるように拡張した.キーワード検出のための認識辞書作成の際には,不要語および雑音の重畳した学習用音声データを合成し,ワードスポッティングによる学習用単語特徴ベクトル抽出時に,各単語境界の音韻環境を考慮した制約条件を設けることで抽出精度の向上を図り,高精度の認識辞書作成を可能とした.また,各単語の複合類似度値の分布を推定し,類似度値を確率的尺度に変換して,キーワード検出の付加・脱落の調整を行った.検出対象としたキーワード30単語を含む100文を成人男性2名が発声した連続音声データに対してキーワード検出実験を行い,類似度を尺度とし孤立単語データで学習する従来の方式と本方式の性能を評価した.従来法ではSN比15dBの環境で,キーワード検出率84.0%(39.3 False Alarms/Hour/Word),本方式ではキーワード検出率91.2%(22.7FA/H/W)の結果が得られ,本方式の有効性が確認された.