連続音声認識への連想情報の利用

関口 芳廣  重永 実  

誌名
電子情報通信学会論文誌 D   Vol.J77-D2   No.8   pp.1522-1530
発行日: 1994/08/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (マルチモーダルインタフェースと要素技術論文特集)
専門分野: 音声,音楽処理
キーワード: 
連続音声認識,  連想情報,  言語情報,  単語予測,  

本文: PDF(525.8KB)>>
論文を購入




あらまし: 
連続音声は「なまけて」はっきり発声しない部分が随所にあり,文法的に重要な助詞などの認識も必ずしも正確にはできないので,連続音声の認識には構文,意味等の言語情報に加え,人間と同様に,より直感的な情報,つまり連想情報の利用も必要である.この論文では,まず連続音声ではあいまいに発声される部分があり,その部分の音響処理が難しいことを示す.次に,人間がもっている単語間の連想関係を調査,検討して,音声認識で使用できる連想単語辞書を構築する.この連想単語辞書を利用して,単語間の連想の強さを求め,後続単語の予測を行う.また,句単位の認識の際,音響的な情報だけでなく,連想情報も加味している.実験の結果,筆者らの音声認識システムで75%以上の文認識率を得るためには,連想情報を利用しないと約90%以上の音素識別率が必要であったが,連想情報の利用により約80%の音素識別率で文認識率が75%以上になっている.また,筆者らの構築したシステムでは,認識のための得点付けには,音響情報と連想情報をほぼ3:1の割合で利用すればよいこともわかった.