ゆう度基準による分析周期・窓長の自動選択手法を用いた発話速度の補正と音響モデルの構築

奥田 浩三  河原 達也  中村 哲  

誌名
電子情報通信学会論文誌 D   Vol.J86-D2   No.2   pp.204-211
発行日: 2003/02/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  発話速度,  補正,  音響分析,  音響モデル,  

本文: PDF(439.6KB)>>
論文を購入




あらまし: 
話し言葉の認識においては,発話速度の変動が認識性能に影響を与えることが報告されており,発話速度の正規化や補正が重要であると考えられる.本論文では発話速度を補正するために,認識時においてゆう度基準により分析周期・窓長を変更する手法を提案する.複数の分析周期・窓長を用いて認識した結果の音響ゆう度・言語ゆう度を比較することにより,発話ごとに適した分析周期・窓長を選択し,結果的に発話速度を補正する.本手法を用いることで,発話速度の変動が大きい講演音声に対して,認識性能が改善されることを確認した.更に,音響モデル学習時に発話速度を補正することを提案する.学習データに対して,複数の分析周期・窓長を用いてビタビアラインメントを行った後,音響ゆう度が最も大きな分析周期・窓長を選択する.本手法を用いて構築した音響モデルを用いて,提案手法により認識を行うことで更に認識性能を改善することができた.