階層的句アラインメントを用いた統計的機械翻訳

渡辺 太郎  今村 賢治  隅田 英一郎  奥乃 博  

誌名
電子情報通信学会論文誌 D   Vol.J87-D2   No.4   pp.978-986
発行日: 2004/04/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 自然言語処理
キーワード: 
統計的機械翻訳,  句アラインメント,  EMアルゴリズム,  

本文: PDF(854.8KB)>>
論文を購入




あらまし: 
統計的機械翻訳には以下の三つの問題が存在することが知られている.(1)対訳関係を規定するモデルの問題,(2)対訳テキストのコーパスからパラメータを決定する,トレーニングの問題,(3)統計的モデルと入力文が与えられたときに,出力文(翻訳)を決定する探索の問題.本論文では,句単位で階層的に対訳文のアラインメントを決定する,階層的句アラインメントを用いることにより上記の問題のうち,モデルの問題とトレーニングの問題の解決を目指す.第1の手法として,階層的句アラインメントに基づき,コーパスをチャンキングし,このチャンクを単位として翻訳モデルを作成した.また,第2の手法として,階層的句アラインメントで表現された対訳文の対応関係を翻訳モデルの対応関係へと変換し,この関係から得られたモデルのパラメータを初期値として更にトレーニングを行った.日英翻訳による実験の結果,両手法とも性能の向上が見られ,特に後者の手法では翻訳率が61.3%から70.0%へと向上した.