Suffix Arrayを用いた高速音声検索語検出システムの性能評価

桂田 浩一  勝浦 広大  入部 百合絵  新田 恒雄  
(システム開発論文)

誌名
電子情報通信学会論文誌 D   Vol.J96-D   No.10   pp.2540-2548
発行日: 2013/10/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (システム開発論文特集)
専門分野: 音声,聴覚
キーワード: 
音声検索語検出,  高速検索,  接尾辞配列,  キーワード分割,  

本文: PDF(1.1MB)>>
論文を購入




あらまし: 
本論文ではコンパクトなデータ構造であるsuffix arrayを利用した高速で大規模メモリを要さない音声検索語検出システムを提案する.このシステムではsuffix arrayを木構造に見立て,ルートノードからDP (Dynamic Programming)マッチングを適用することによって,インデックスサイズの小さい高速音声検索語検出を実現している.また検索キーワードが長くなると検索時間が指数的に増加するという問題に対応するために,長いキーワードを分割検索する方法を取り入れている.本検索システムの性能を評価するため,N-gramインデックスを用いた基礎的な手法及び他の高速検索法と,検索精度,検索時間,インデックスサイズを比較した.その結果,本システムでは検索精度を損なうことなく他の手法と同程度の高速検索を実現できている事が確認できた.また,インデックスサイズは他の主要な手法と比べて十分の一以下であることが確認できた.