電話音声の連続音声認識に基づく内線電話受付装置の試作と評価

黒岩 眞吾  武田 一哉  井ノ上 直己  野垣内 出  山本 誠一  庄境 誠  尾和 邦彦  長濱 克昌  

誌名
電子情報通信学会論文誌 A   Vol.J77-A   No.2   pp.223-231
発行日: 1994/02/25
Online ISSN: 
DOI: 
Print ISSN: 0913-5707
論文種別: 特集論文 (不特定話者音声認識論文特集)
専門分野: 対話システム
キーワード: 
不特定話者音声認識,  連続音声認識,  実時間処理,  電話,  対話システム,  

本文: PDF(672.5KB)>>
論文を購入




あらまし: 
内線電話への接続をタスクとする音声対話システムを作成した.同システムは200人規模の組織の電話受付業務を行うもので,電話で所属と名前を言うだけで相手の内線に電話をつなぐシステムである.不特定話者の連続音声認識を実時間で行うために専用のハードウェアを開発した.ハードウェアは浮動小数点DSP9個の疎結合マルチプロセッサ方式で結合し,パイプライン処理により,エコーキャンセル,音響分析,HMMのゆう度計算および単語レベル,文法レベルでのビタビ演算を並列に実行する.並列化にあたっては,最も処理の重くなったプロセッサにプロセッサ間のデータ転送に伴う待ち時間が生じないようなパイプラインスケジューリングを行っている.また,タスクサイズが大きくなった場合でも音響分析は一定の周期で行えるよう同期処理,非同期処理を混在させた構成とした.電話回線経由で収集した400名の発声による音素バランス4,000文を用いて学習した音素モデルを用い実環境で評価したところ,91%の呼に対して正しい相手の内線番号が案内でき,それに要した平均所要時間は41秒であり,多くのユーザによる利用が期待できる性能であることが確認された.