単語・クラス統計の融合と汎用コーパスの選択的利用に基づく小規模目的タスクコーパスからの頑健な言語モデル作成法

和田 陽介  小林 紀彦  小林 哲則  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.11   pp.2397-2406
発行日: 2000/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声情報処理:現状と将来技術論文特集)
専門分野: 将来技術の基礎理論:音声認識・理解・対話
キーワード: 
大語彙連続音声認識,  言語モデル,  クラスN-gram,  タスク適応,  

本文: PDF(332.4KB)>>
論文を購入




あらまし: 
言語モデル学習用テキストコーパスの大量収集が困難な音声認識タスクにおける言語モデルの高精度化を目的として,融合bigram法,汎用テキストの選択的利用法を提案した.融合bigramでは,単語bigramとクラスbigramを先行単語頻度と後続単語種類数の関数として表される重みを用いて融合する.実験の結果,提案する融合bigramは約3倍の学習データの単語bigramに匹敵する精度を与えることが明らかになった.汎用テキストの選択的利用では,タスクを特定せず収集した大量テキストから精度向上が予測される文を自動的に選出し,小規模目的タスクコーパスに追加することで言語モデルの補正を行った.実験の結果,テキストの選出をしない場合に比べ最大約12%誤認識率が改善した.最後に,融合bigramとテキスト追加を併用したモデルを作成した結果,更に改善し,目的タスクのテキストのみから作成した単語bigramより,補正パープレキシティで約34%,誤認識率で約31%改善することに成功した.