ピッチパターンのクラスタリングに基づく不特定話者連続音声の句境界検出

中井 満  下平 博  嵯峨山 茂樹  

誌名
電子情報通信学会論文誌 A   Vol.J77-A   No.2   pp.206-214
発行日: 1994/02/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 特集論文 (不特定話者音声認識論文特集)
専門分野: 連続音声認識
キーワード: 
句境界検出,  韻律情報,  不特定話者,  連続音声認識,  

本文: PDF(610.5KB)>>
論文を購入




あらまし: 
ピッチパターンと学習アクセントパターン(ピッチテンプレート)との連続整合による不特定話者連続音声のアクセント句境界検出法を提案する.1個のアクセント核を有する句(アクセント句)とそれに対応するピッチパターンには相関があると考えられ,アクセント句に対応するピッチパターンをクラスタリングにより分類することで,特徴的なピッチテンプレートが得られる.連続音声のピッチパターンもこれらのピッチテンプレートの連接となるので,ピッチパターンとピッチテンプレートのOne-Stage DP整合により,句境界を容易に推定することができる.また,整合時にピッチテンプレートを高さ方向にスライドさせることにより,平均ピッチ周波数の異なる不特定話者への適用が可能である.ATR連続音声データベース(話者10名,503文)を用いた実験では,テンプレート数8の場合で,自動検出された句境界のうちの約65%程度が正解であり,実際の句境界の約83%を検出することができた.