複合類似度法を用いた不特定話者単語音声認識

新田 恒雄  村田 敏健  松浦 博  斉藤 悦生  

誌名
電子情報通信学会論文誌 A   Vol.J67-A   No.11   pp.1076-1081
発行日: 1984/11/25
Online ISSN: 
DOI: 
Print ISSN: 0373-6091
論文種別: 論文
専門分野: 
キーワード: 


本文: PDF(477.9KB)>>
論文を購入




あらまし: 
複合類似度法を用いた単語音声認識の分析方法(プリエンファシス特性・分析フィルタ構成),時間軸の正規化方法および登録話者数について検討している.まず,男性120名,女性100名の試料を用いて5母音の認識実験を行ない,4種類のプリエンファシス特性と5種類のフィルタ・バンクを比較する.次に,単語音声試料を用いて時間軸の再サンプル点抽出方法を線形伸縮と非線形伸縮とで比較評価する.登録話者数の検討では,男性200名,女性320名の発声した試料から複合辞書を作成し,男女各50名の非学習試料で実験している.20単語程度の比較的小規模の語彙を対象とする場合,男女共通の辞書を用いたときの男女評価試料の認識結果と,男性(女性)辞書を用いて男性(女性)試料を認識した結果の間に大きな差はない.また登録話者数は,男女共通の複合辞書を作成する場合,少なくとも男女各々100名以上の試料を用いる必要がある.登録話者数520名(男性200名,女性320名)のときの認識率は,男性で99.5%,女性で98.7%,平均99.1%であった.