知識処理に基づく音声自動ラベリングシステム

荒井 和博  鬼山 康人  野村 康雄  山下 洋一  北橋 忠宏  溝口 理一郎  

誌名
電子情報通信学会論文誌 D   Vol.J74-D2   No.2   pp.130-141
発行日: 1991/02/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声処理
キーワード: 


本文: PDF(853.7KB)>>
論文を購入




あらまし: 
連続音声を音素単位に分割する処理,いわゆるラベリングは音声データベースを構築する上での重要な処理の一つである.現在のところラベリングは,人間の専門家が音響パラメータ時系列を視察することにより手作業で進められている.このため音声データベース構築には,多大な時間と労力が必要とされている.これらの背景から我々は,ラベリングの自動化を目的とした音声自動ラベリングシステムを開発した.本システムは,まず音素記号列と音響パラメータの特徴的変化を対応づけ,音素のおおよその位置を設定する.その後,音素境界付近の音響パラメータの変化を詳細に観察して境界位置を調整する.最後に,各音素区間内における音響パラメータの変化に着目してラベルの整合性を検証する.本システムの評価実験では,ルール開発の際に参照した,成人男性7名の発声による8文章に対して,6.7%の音素境界が棄却されたが,残りの音素境界のうち99.1%を専門家が決めた位置から30ms以内に決定できた.またルール開発の際に参照していない,成人男性4名の発声した10文章に対してはそれぞれ,8.9%,95.5%の性能が得られ,本システムの有効性が明らかになった.