音声認識を用いたWWWブラウザとその評価

近藤 和弘  チャールズ ヘンプヒル  

誌名
電子情報通信学会論文誌 D   Vol.J81-D2   No.2   pp.257-267
発行日: 1998/02/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
WWW,  音声認識,  ユーザインタフェース,  テキスト-音素列変換,  

本文: PDF(798.4KB)>>
論文を購入




あらまし: 
不特定話者連続音声認識を用いて,音声でWorld Wide Web (WWW)ブラウザが制御可能なシステムを試作した.このシステムでは現在ブラウズしているページ中のアンカー名を読むことにより,そのリンク先のページに進むことができる.また,音声を用いて,ブラウザを制御することも可能である.新しいWWWページに移行するたびにブラウズ中のページからアンカー名を抽出し,これを音素列に変換し,文法を作成し,音声認識システムに与えて語いをダイナミックに切り換える.このとき,日付,年齢などの例外的な読み方に対応する必要がある.簡単な音素列変換テストの結果,最も正答に近い候補中に97%の正しい音素列が含まれていることが確認された.更に,日本語ページには英文アンカー名も多く含まれるため,限定語いの英語も認識できるようにした.簡単なユーザテストの結果,91.5%のタスク達成率を得た.エラーの原因は音声認識精度によるものよりむしろユーザの誤読,音声検出ミス等の方が多いことがわかった.不慣れなために起こるユーザ誤操作を除いたタスク達成率は94.1%である.