中国語連続音声の四声認識

謝 景棠  古市 千枝子  今井 聖  

誌名
電子情報通信学会論文誌 D   Vol.J71-D   No.4   pp.661-668
発行日: 1988/04/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5713
論文種別: 論文
専門分野: 音声処理
キーワード: 


本文: PDF(733.2KB)>>
論文を購入




あらまし: 
中国語音声は,同じ音素で構成された音節が声調によって異なる意味をもつので,音声認識を行うためには,まず四声の認識を正確に行うことが重要である.連続音声における音節内のピッチパターンは,隣接音節の影響を強く受けるため,単音節単語のように四声の特徴をはっきり示さなくなる.中国語連続音声の四声認識が,単音節単語の四声認識より困難であるのは,これが主な原因となっている.しかし,隣接音節の影響は音節間の境界近辺で最大となるので,この部分を含まないように適当な長さの区間をとることで,調音結合の影響は軽減されると考えられる.そこで,本論文では,この考えに基づき,各音節ごとに音節核と音節尾を求め,これらをピッチパターンの始点および終点として用いる新しい四声認識法を提案する.音節核は,音声波形のパワーパターンおよびピッチパターンの特徴を用いて,また,音節尾は音節核間のパワーの変化のみを用いて,高い正解率で抽出できる.この音節核および音節尾を用いてセグメンテーションを行い,四声のピッチパターンモデルとの距離の比較による四声認識を行う.得られた四声認識率は視察による結果に近いものとなった.