順向マスキングの時間周波数特性を模擬した動的ケプストラムを用いた音韻認識

相川 清明  河原 英紀  東倉 洋一  

誌名
電子情報通信学会論文誌 A   Vol.J76-A   No.11   pp.1514-1521
発行日: 1993/11/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 論文
専門分野: 音声
キーワード: 
マスキング,  聴覚モデル,  スペクトル,  動的特徴,  HMM,  音声認識,  

本文: PDF(594.2KB)>>
論文を購入




あらまし: 
聴知覚上重要な順向マスキングの時間周波数特性を模擬した動的ケプストラムパラメータを提案する.聴覚心理学的研究報告によると,順向マスキングパターンはマスーとマスクされる信号音の時間差が大きいほど周波数平滑化される.動的ケプストラムはこの特性に基づき動的特徴を強調したスペクトルパラメータで,マスカーと信号の時間差に依存して通過特性が変わるケプストラムリフタ群を用いる新しい演算手法を導入することにより実現できた.本方法は,先行する音韻に依存したスペクトルの微細形状の影響を受けにくい利点がある.動的ケプストラムは音声全体に重畳したスペクトルの傾斜等の平均的な偏りを除去しつつホルマント移動等の動的な特徴を強調する機能をもち,スペクトルの動的特徴と静的特徴を併せて表現できるという長所がある.隠れマルコフモデルを用いた音韻認識実験の結果,動的ケプストラムを用いると通常のケプストラムより高い認識率が得られることがわかった.動的ケプストラムは多数の話者の音声や,発話様式の違う音声に対しても有効である.