テキストコーパスを用いた音声理解のための言語モデル自動獲得

松岡 達雄  ロバート ハッソン  ステファニー ダル  マイケル バーロウ  古井 貞煕  

誌名
電子情報通信学会論文誌 D   Vol.J79-D2   No.12   pp.2070-2077
発行日: 1996/12/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声言語によるコミュニケーションシステムの実現に向けて(音声認識,合成,対話処理,システム構築の諸問題)論文特集)
専門分野: 音声認識用言語モデル,認識後処理
キーワード: 
音声理解,  翻訳,  言語モデル,  自然言語,  意味言語,  

本文: PDF(592.9KB)>>
論文を購入




あらまし: 
本論文では音声理解システムにおいて,音声認識結果である自然言語を,システムを駆動する意味言語に交換するための言語モデルを,コーパスから自動的に獲得する方法について述べる.提案法では,まず,自然言語/意味言語における単語を,出現する文脈の類似度を尺度とした統計的なクラスタリングによりグループ化する.次に,自然言語,意味言語をそれぞれネットワーク文法で表現し,自然言語の文法ネットワーク中の状態遷移と対応する意味言語の文法ネットワーク中の状態遷移間の共起確率を,自然言語と意味言語が1対となったコーパスを用いて推定する.この共起確率を翻訳言語モデルとして自然言語から意味言語への交換を行う.単語のクラスタリングによりネットワーク中の状態数が削減されているため,スパースデータからの推定の問題を回避し,頑健な翻訳言語モデルを推定することができる.米国ARPAの音声理解評価タスクである航空旅行情報システム(Air Travel Infomation System: ATIS)を対象として評価を行い,提案法の有効性を示す.