計算機との対話のための非言語音声の認識と合成

金澤 博史  クリス マエダ  竹林 洋一  

誌名
電子情報通信学会論文誌 D   Vol.J77-D2   No.8   pp.1512-1521
発行日: 1994/08/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (マルチモーダルインタフェースと要素技術論文特集)
専門分野: 音声,音楽処理
キーワード: 
音声認識,  音声合成,  非言語音声,  感情,  意図,  対話,  

本文: PDF(702.5KB)>>
論文を購入




あらまし: 
計算機との自然なマルチモーダルインタフェースを実現するための非言語音声の認識と合成について述べる.日常の対話に頻繁に用いられる「えー」,「あー」などの非言語音声の性質を調べるために,男女各2名の俳優の意図,感情を表す非言語音声の韻律的特徴を分析した.この分析結果をもとに,「同意」,「疑い」,「なるほど」,「悲しみ」の4種類の感情を表すファジー論理を用いた非言語音声の合成システムを構築し,その有効性を確認した.まず,非言語音声の前処理について検討を行い,非言語音声パターンを基本周波数情報を含む時間周波数スペクトルで表現し,複合類似度法による認識実験を行った.成人女性2名が発声した「驚き」「肯定」「否定」「疑い」「つなぎ」「なるほど」の6種類の感情を表す非言語音声データに対して,音韻の種類に制限を設けた場合91.0%,制限を設けない場合88.8%という結果が得られた.「肯定」「否定」「疑い」「つなぎ」の4種類の感情を表す非言語音声の認識実験では,96.9%の認識率が得られた.また,DSPアクセラレータを用いて非言語音声のスポッティングを行う実時間システムを構築し,非言語音声認識が自然な対話実現のために有効であるとの見通しを得た.