自然発話音声クエリの音響・言語特徴を利用した音声内容検索

田崎 広人  秋葉 友良  

誌名
電子情報通信学会論文誌 D   Vol.J101-D   No.3   pp.597-606
発行日: 2018/03/01
Online ISSN: 1881-0225
DOI: 10.14923/transinfj.2017PDP0035
論文種別: 特集論文 (学生論文特集)
専門分野: 音声,聴覚
キーワード: 
音声内容検索,  自然発話クエリ,  音響特徴,  言語特徴,  

本文: PDF(604KB)
>>論文を購入


あらまし: 
音声を利用した情報検索システムは,ユーザの情報収集をより容易にする存在として期待されている.しかし従来の音声検索システムではあらかじめ発話内容を決定しておかなければならなく,要求が複雑になるほどに適切なキーワードを考えるための時間が必要であった.この問題を解決するため,ユーザが思いつくままに発話した場合においても,要求を理解して関連する内容を提示できる音声検索システムの開発が求められる.本研究では,思いつくままに発話された音声クエリを効果的に利用するための音声内容検索の拡張手法を提案する.音声クエリにおいて,要求の内容を表す可能性がある単語の音響特徴は,他の単語と比較して顕著である可能性があり,同時に言語的観点からみても,文書の内容を示す単語は,他の単語と比較して特異的であると考えられる.これらの仮定から,我々は音響特徴と言語特徴を用いて自然発話音声クエリに含まれる各単語が検索に貢献する度合を推定し,確率を利用した検索モデルであるクエリゆう度モデルに組み込んだ.提案手法の有効性を検索性能評価実験により検証し,様々な条件下で検索性能が向上した.