並列音素ラベリング(PPL)方式による話者独立単語音声認識

今井 聖  谷口 一郎  古市 千枝子  川崎 智之  土居 仁士  

誌名
電子情報通信学会論文誌 A   Vol.J77-A   No.2   pp.143-152
発行日: 1994/02/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 特集論文 (不特定話者音声認識論文特集)
専門分野: 音響モデル
キーワード: 
話者独立単語音声認識,  並列音素ラベリング方式,  記号別マッチング,  音素セグメンテーション,  

本文: PDF(749.7KB)>>
論文を購入




あらまし: 
音素レベルに自動的に時間区分化された音声のセグメントのラベリングを複数の異なる音素レファレンスパターンセットを用いて並列に行い,その結果得られた複数の音素ラティスと辞書項目との記号別マッチングを音素ラティスごとに行うことにより単語の認識を行う形の話者独立単語音声認識システムを提案し,実験によりその有効性を確かめた.発声様式や声質の大きく異なる話者には,別々に音素レファレンスパターンセットを用意し,それらを用いて並列に音素ラベリングを行えば,任意の話者の音声に対していずれかの音素レファレンスパターンセットが適切に対応することになる.単語の認識の段階で結果的に音素列の認識が行われるようになっており,音素ラベリングの段階で複数の音素レファレンスパターンセットの中から入力話者に適合したレファレンスパターンセットを特定するための付加的な処理は不要である.男性3名と女性3名が発声した音声データをもとにして各話者ごとに作成した6セットの音素レファレンスパターンセットを利用して並列音素ラベリング方式による単語音声認識システムを構成し,レファレンスパターン作成のための話者とは別の6名の男性と6名の女性の合計12名の話者が発声した音韻バランス単語212語に対する話者オープンの音声認識実験を行ったところ,全話者に対する平均認識率が88.2%,話者別の最低認識率が83.0%となり,男女すべての話者による六つの音素レファレンスパターンセットを混合して得た話者独立型のレファレンスパターンセットを用いたシステムと比較して,本提案のシステムは平均認識率で1.9%,話者別の最低認識率で5.2%高く,話者独立型の単語音声認識システムとして良い結果が得られた.