会話音声の機械認識における音響処理

中津 良平
好田 正紀

誌名
電子情報通信学会論文誌 D   Vol.J61-D    No.4    pp.261-268
発行日: 1978/04/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5713
論文種別: 論文
専門分野: 
キーワード: 


本文: PDF(709.4KB)>>
論文を購入



あらまし: 
会話音声認識系における音響処理の構成と性能について述べる.認識系は,音響処理部,言語処理部,音声応答部から構成されている.認識の対象の具体例として列車の座席予約をとり,オンラインで質問回答形式によって予約を実行する.音響処理部の特徴は次の4点である.(1)音声の分析を最尤スペクトル分析で行うことにより,精密なスペクトル情報の抽出をはかった.(2)音韻に関する音声学的な知識をtop-down的に利用して音韻認識を行う方法を採用した.(3)比較的学習の容易な母音標準パターンのみを発声者ごとに作成する方式をとり,発声者に対する適応性を高めた.(4)音声情報処理用の高速プロセッサを用いることにより,処理の高速化をはかった.男性8名が文節ごとに区切って発声した座席予約の文章を用いて認識実験を行った.処理結果は,セグメント化のあいまいさと音韻認識のあいまいさを含む音韻ラティスの形に表現した.この音韻ラティスに正しい音韻が含まれる割合は78.6%であり,音韻ラティスの持つ情報量から計算した音韻認識率は58.5%であった.言語処理と合せた会話音声認識システム全体では86.0%の文節認識率が得られ,良好に動作することが確かめられた.