自然発話中の有声休止箇所のリアルタイム検出システム

後藤 真孝  伊藤 克亘  速水 悟  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.11   pp.2330-2340
発行日: 2000/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声情報処理:現状と将来技術論文特集)
専門分野: 現状技術の応用:音声認識・理解・対話
キーワード: 
有声休止,  いいよどみ,  つなぎ語,  自然発話,  対話,  

本文: PDF(406.9KB)>>
論文を購入




あらまし: 
本論文では,代表的ないいよどみ現象である有声休止(音節の引き延ばしも含む)を自動的に検出する手法を提案する.有声休止は音声対話において発話権の保持等の大切な役割を果たしており,その検出は音声対話システムを実現する上で重要である.従来,サブワード単位に基づく連続音声認識やワードスポッティングの枠組みで有声休止に対処する研究事例はあったが,いいよどみ現象として個々に検出しておらず,その役割を把握して適切に扱うことはできなかった.本手法は,有声休止中は調音器官の変化が小さいことに着目し,音韻的に変化が少ない持続した有声音(有声休止音)を検出する.その際,ボトムアップな信号処理によって,有声休止音がもつ二つの音響的特徴(基本周波数の変動が小さくスペクトル包絡の変形が小さい)を検出することで,トップダウン情報を使わない言語非依存な検出を可能とする.本手法をリアルタイムに実行するシステムを実装し,有声休止箇所のマーク付け作業を施した日本語の音声対話コーパスを用意して,評価実験を行った.その結果,30名の話者の自然発話に対し,F値0.726の精度で有声休止を検出できることが確認された.