部分距離空間上の索引付けに基づく音声中の高速検索語検出手法

金子 泰輔  秋葉 友良  

誌名
電子情報通信学会論文誌 D   Vol.J95-D   No.3   pp.608-617
発行日: 2012/03/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (学生論文特集)
専門分野: 音声,聴覚
キーワード: 
音声中の検索語検出,  ハフ変換,  近似文字列照合,  部分距離空間上索引付け,  

本文: PDF(919.6KB)>>
論文を購入




あらまし: 
我々は,部分距離空間上の索引付けに基づく音声中の検索語検出(Spoken Term Detection; STD)のための新しい手法を提案した.提案手法は,検索語音素列と検索対象音素列の間の音素間距離行列を作り,音素間距離を画素濃度とみなすことにより,STDを画像中の直線検出タスクとして捉える.提案手法の大きな特長は,索引に含まれる距離情報に基づきもっともらしい候補から順番に検索結果を高速に出力することである.そのため,従来手法のように検索の際に,必ずしもしきい値を設定する必要はない.我々は,講演音声を対象とした予備実験を行い,高速な検索語検出が可能であることが確認できた.更に我々は,高速化のため,検索アルゴリズムを改良し,また,処理効率を落とすことなく複数音声認識候補を扱えるように拡張することを試みた.講義音声を対象とした実験により,拡張した提案手法でより高速な検索が可能であり,わずかに再現率が向上するという結果が得られた.