会議録作成支援のための国会審議の音声認識システム

秋田 祐哉  三村 正人  河原 達也  
(システム開発論文)

誌名
電子情報通信学会論文誌 D   Vol.J93-D   No.9   pp.1736-1744
発行日: 2010/09/01
Online ISSN: 1881-0225
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
話し言葉音声認識,  国会,  言語モデル,  音響モデル,  発音辞書,  

本文: PDF(543.9KB)
>>論文を購入


あらまし: 
我々は国会審議の会議録作成支援を想定した音声認識システムの研究開発に取り組んでいる.会議録では原則として発話をすべて書き起こして記録することから,音声認識を活用する際には高い認識精度が求められる.このため,本研究では衆議院の審議音声からなるコーパスの整備を進めるとともに,これを用いた高精度の音響モデル・言語モデル・発音辞書の検討を行ってきた.音響モデルについては,種々の正規化手法に加えて最小音素誤り(MPE)学習を導入した.また言語モデルと発音辞書に関しては,話し言葉音声向けのモデルを生成するために発話スタイルの統計的変換手法を適用し,4-gram統計言語モデルと発音の変異形を含む辞書を構築した.これらのモデルに基づく音声認識システムについて実際の審議音声における評価を行ったところ,それぞれの手法が有効に機能していることが確認され,最終的には86%の文字正解精度が得られた.