特定話者任意語い連続音声の音素認識

古市 千枝子  今井 聖  

誌名
電子情報通信学会論文誌 D   Vol.J73-D2   No.4   pp.501-511
発行日: 1990/04/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 


本文: PDF(966.3KB)>>
論文を購入




あらまし: 
入力音声を音素単位にセグメンテーションした後に識別を行う方式の音素認識システムを構成し,任意語いの連続音声認識のための音素標準パターンの作成法を提案し,音素認識実験によりその有効性を示した.本システムは音響分析部,セグメンテーション部,音素特徴パラメータ抽出部および音素識別部によって構成され,構造的手法に基づいている.各部分システムは極めて明確な機能をもつ機構となっているため,パターンに関する知識が組み込みやすいという利点がある.女性と男性の音声に対して,音響分析の条件,セグメンテーションおよび音素識別のアルゴリズム,そこで用いるしきい値などはすべて共通であり,音響分析で得られるスペクトル包絡パラメータはセグメンテーションパラメータの抽出だけでなく音素の特徴パラメータとしても利用することができるなどの特徴をもつ.本論文では,学習データとしてVCVバランス単語セット(492語)を用いて男女各1名の音素標準パターンを作成し,学習データとは異なる語いの多音節単語の音声に対する音素認識に適用した結果について報告する.600語の多音節単語音声に対する音素的単位の総数と音素認識率は女声が5100個で84.0%,男声が4828個で81.6%であり,脱落率はそれぞれ0.9%(48個)と1.9%(93個)という結果を得た.