全国音声翻訳実証実験の実施と実利用データを用いた音声認識のモデル適応

磯谷 亮輔  松田 繁樹  林 輝昭  河井 恒  中村 哲  

誌名
電子情報通信学会論文誌 D   Vol.J96-D   No.1   pp.209-220
発行日: 2013/01/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  音声翻訳,  実証実験,  実利用データ,  モデル適応,  

本文: PDF(2MB)>>
論文を購入




あらまし: 
全国5地方で実施した大規模音声翻訳実証実験の概要と,そこで得られた実利用音声データを用いた音声認識の音響モデル,言語モデルの適応について述べる.モデル適応の評価では,まず人手による書き起こしを用いた適応の評価を行い,各地方約1万発話の実利用データを用いた適応により,39%の誤り率削減が得られることを確認した.個別の分析では,音響モデル適応と言語モデル適応の効果の度合は地方プロジェクトごとに違いが見られること,言語モデルは地方依存性が高いのに対し音響モデルは他地方のデータの利用も有効であることが確認された.更に,書き起こしを必要としない手法として,実利用データを音声認識した結果を信頼度で選別して書き起こしの代わりに用いる教師なし適応の評価を行った.その結果,音響モデル,言語モデルとも,誤り削減率で書き起こしを用いる場合の4割以上の効果が得られ,これらを組み合わせることで,17%の誤り率削減が得られた.これらの結果により,実利用データを利用したモデル適応の有効性,その効果の要因別の可搬性,更に人手をかけない自動更新による音声認識精度の逐次改善の可能性を示すことができた.