単語誤り最小化に基づく識別的リスコアリングによるニュース音声認識

小林 彰夫  奥 貴裕  本間 真一  佐藤 庄衛  今井 亨  都木 徹  

誌名
電子情報通信学会論文誌 D   Vol.J93-D   No.5   pp.598-609
発行日: 2010/05/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
ラティスリスコアリング,  識別学習,  単語誤り最小化,  リランキング,  

本文: PDF(417.7KB)>>
論文を購入




あらまし: 
本論文では,ニュース音声認識のための,単語誤りの傾向を反映した識別的リスコアリング手法を提案する.提案手法では,音声認識の第2パスにおけるラティスリスコアリングの際,単語仮説の誤り傾向に応じて,対数スコア(音響・言語スコア)にペナルティを与える.単語仮説へのペナルティは,言語的な文脈により活性化する素性関数とその重みにより定められる.提案手法の特徴は,学習データの音声認識結果のラティスを利用して,このラティスの単語誤り数に基づく目的関数を最小化するように素性関数の重みを求めることと,ニュースの話題の時間的関連性を利用した時期依存適応学習によって,認識率の改善を図ることにある.ニュース音声を用いたリスコアリング実験の結果,時期依存適応学習を適用した提案手法は単語誤り率が7.4%となり,従来のtrigramによるラティスリスコアリングに比べて,6.3%の単語誤り削減率を得た.また,従来の対数回帰に基づく識別的リスコアリング手法と比較して,5.1%の単語誤り削減率を得た.