連続音声の音素的単位へのセグメンテーション

今井 聖  古市 千枝子  

誌名
電子情報通信学会論文誌 D   Vol.J72-D2   No.1   pp.11-21
発行日: 1989/01/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 


本文: PDF(887.1KB)>>
論文を購入




あらまし: 
朗読速度の連続音声の音素的単位へのセグメンテーションの方法を示している.本セグメンテーションシステムでは,連続音声をまず有声音区間と無声音区間の二つのクラスに分け,2分したそれぞれの区間において更に細かな音素的単位へのセグメンテーションを行っている.セグメンテーションには全部で5種類のパラメータを用いるが,セグメンテーションを階層的に行うことによって,各部分のセグメンテーションに対して適切なパラメータとアルゴリズムを選ぶことができる.4種類の主なセグメンテーションパラメータは対数スペクトルの不偏推定法によって得たスペクトル包絡から求めたものである.スペクトル包絡などの時間変化を表すパラメータの抽出には特殊な擬似微分フィルタを利用している.男女各3名が発声した約80秒分の連続音声に対するセグメンテーションの実験により,この方法の有効性が確認された.この音声に対応する文章の読みにおける音素的単位の総数1,012個に対し,セグメンテーションのエラーは音素的単位の脱落が22個,付加が16個で全体で3.8%であった.