異なる体系を接続するための識別モデルを用いた形態素変換法

今村 賢治  泉 朋子  貞光 九月  齋藤 邦子  小橋川 哲  政瀧 浩和  

誌名
電子情報通信学会論文誌 D   Vol.J96-D   No.1   pp.239-249
発行日: 2013/01/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 自然言語処理
キーワード: 
形態素変換,  識別モデル,  形態素解析,  句に基づく統計翻訳,  音声認識,  

本文: PDF(865.5KB)>>
論文を購入




あらまし: 
構文・意味解析などの自然言語処理モジュールや音声認識器を組み合わせた統合システムを構築する際,モジュール同士の形態素体系が異なっていると直接接続できない.この問題を解決するため,本論文では異なる形態素体系を変換する,形態素変換法を提案する.提案方式は,句に基づく統計翻訳(PBSMT)の考え方を利用するが,本タスクの特性を生かして,条件付き確率場を統計モデルとして使用する.実験では,PBSMTの実装であるMOSESに比べ高精度な変換ができ,音声認識結果のように誤りを含んだ入力に対しても,いったんテキストに戻して形態素解析する方式に比べ誤りに頑健な変換ができた.また,訓練コーパスサイズの精度への影響を調査し,変換元から変換先へ形態素をマッピングするフレーズテーブルの網羅性が,変換時/訓練時双方で重要であることを確認した.