スペクトルのローカルピークを用いた不特定成人男性話者を対象とする単語音声認識システム

牧野 正三
川端 豪
三輪 譲二
城戸 健一

誌名
電子情報通信学会論文誌 D   Vol.J67-D    No.11    pp.1364-1371
発行日: 1984/11/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5713
論文種別: 論文
専門分野: 
キーワード: 


本文: PDF(603.8KB)>>
論文を購入



あらまし: 
本論文では,スペクトルのローカルピークを用いた不特定男性話者を対象とする単語音声認識システムについて述べる.音素認識部では,スペクトルのローカルピークの他にスペクトルのグロスな情報を用いる事によって音素認識率を改善する.又,従来反映されていなかった音素認識部の信頼度を事後確率の形で表現し,単語認識に用いる.事後確率を用いることによって,音素による特徴パラメータの数や種類の違いを吸収することができる.標準話者5名に不特定話者18名を加え,計23名の成人男性話者の発声した166都市名単語に対する認識実験を行った.その結果89.0%の認識率が得られた.この値は従来のシステムに比べて約4.4%の改善である.信頼度を併用した方がコンフュージョンマトリクスのみのものより,約2.5%優れている.差し引き1.9%が音素認識の改善によるものと考えられる.