日本語ディクテーションシステムにおける被覆率の高い言語モデル

廣瀬 良文  伊藤 克亘  鹿野 清宏  中村 哲  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.11   pp.2300-2308
発行日: 2000/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声情報処理:現状と将来技術論文特集)
専門分野: 現状技術の応用:音声認識・理解・対話
キーワード: 
日本語ディクテーション,  読み情報,  単語被覆率,  未知語,  

本文: PDF(286.5KB)>>
論文を購入




あらまし: 
日本語の表記法は,仮名漢字混じりである.そのため,同一の語に対しても多様な表記が可能である.大語彙連続音声認識では,無限の語彙を扱うことは不可能であるため,語彙を制限する必要がある.このとき,言語の被覆率が低下する.発話文に未知語が存在した場合には,その単語のみが認識誤りを起こすのではなく,その前後の単語にも影響を与える.したがって,ディクテーションなどでは,より広い語彙を被覆することは実用上非常に重要である.本論文では,形態素解析システムにより得た形態素の読み情報を利用することにより,被覆率の高い統計的言語モデルの構築を試みた.「読み」表記による言語モデル,及び「読み」表記と「漢字」表記を混合した言語モデルを構築し,未知語率を約50%削減した.評価として,語彙サイズの影響を検証するために未知語の存在しない評価文に対する認識実験,及び単語被覆率の改善による認識性能の評価のために未知語を含む評価文に対する認識実験を行った.5千語,2万語,3万語のディクテーションシステムにおいて認識率の改善が見られ,効果が確かめられた.一方,未知語の存在しない評価文に対しては語彙サイズを大きくすることによる悪影響はないことを確認した.