単語を認識単位とした日本語ディクテーションシステム

西村 雅史  伊東 伸泰  

誌名
電子情報通信学会論文誌 D   Vol.J81-D2   No.1   pp.10-17
発行日: 1998/01/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
大語い音声認識,  形態素解析,  HMM,  N-gram,  パープレキシティ,  

本文: PDF(581.4KB)>>
論文を購入




あらまし: 
単語を認識の単位とした日本語ディクテーションシステムについて検討した.欧米では既にいくつかのシステムが実用化されているが,日本語においては,単語の概念が明確でないため,N-gram等の言語モデルの導入が容易ではなく,研究が遅れた.最近,形態素を認識単位とした研究が盛んになってきているが,離散単語発声も可能なシステムとなると,ほとんど検討されていない,本論文では,日本人の考える,単語の切出し方を統計的にモデル化する方法を提案する.この方法によって抽出された単語単位を認識および発声の単位として,不特定話者日本語ディクテーションシステムを構築し,その性能を評価した.約4万語の辞書を用意したところ,新聞記事に対しては95.5~98%の単語カバレージが得られた.また,男女各10名の離散単語発声による新聞記事の読み上げ文に対して認識実験を行ったところ,単語誤り率は3.2%であった.