音声認識研究の動向

中川 聖一  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.2   pp.433-457
発行日: 2000/02/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: サーベイ論文
専門分野: 音声,聴覚
キーワード: 
音声認識,  音響モデル,  HMM,  言語モデル,  n-gram,  

本文: PDF(691.6KB)>>
論文を購入




あらまし: 
本論文では音声認識の最近の研究動向について述べる.まず,はじめに,現在の機械による音声認識能力がまだ人間の能力に及ばないことを述べ,特に音響モデルの改善が必要なことを論じる.次に実用化にとって重要な雑音等に頑健な特徴パラメータや前処理について述べる.情報理論やパターン認識の立場から認識対象と同じ環境で収集された多量の音声サンプルを用いることが有用であることを指摘する.次に音声認識の中心技術である音響モデルと言語モデルについて述べる.まず,音響モデルの中心技術となっている隠れマルコフモデル(HMM)の原理と限界を述べ,最近の改良研究について詳述する.言語モデルの音声認識における役割は,発声され得ない認識候補の除外,すなわち探索空間の削減にある.言い換えればエントロピーを小さくするモデルが好ましいという観点から統計的な言語モデルの最近の研究動向を述べる.最後に,音声認識システムを構築するのに留意すべき点について論じる.