音声認識誤りと未知語に頑健な音声文書検索手法

西崎 博光  中川 聖一  

誌名
電子情報通信学会論文誌 D   Vol.J86-D2   No.10   pp.1369-1381
発行日: 2003/10/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音声文書検索,  ワードスポッティング,  未知語検出処理,  ハイブリッドインデックス,  

本文: PDF(828.5KB)>>
論文を購入




あらまし: 
本論文では,未知語を含んだ音声文書をロバストに検索できる,ニュース音声を対象とした音声文書検索システムについて述べる.音声文書を検索する一つの方法としては,音声認識により自動的に音声を単語列に書き起こし,これとキーワードとを直接マッチングする方法が一般的である.しかしこの場合,キーワードが未知語であれば,そのキーワードは他の既知語へ誤って認識されてしまうため,そのキーワードを含む音声文書とマッチングできない.この問題を避けるため,単語ベースのインデックスと音節ベースのインデックスの両方を用いる方法を提案する.音節ベースのインデックスは,未知語処理機能付きの音声認識器を使って作成する.本研究では,既知語のキーワードに対しては単語インデックスとのマッチングを,未知語のキーワードに対しては音節インデックスとのDPマッチング,若しくは音声とのHMMによるワードスポッティングを行うことで,両方のインデックスの利点をうまく利用する.2種類のインデックスを利用することで,検索語に含まれる未知語のキーワードを含んでいる文書でもロバストに検索できることが明らかにされた.また,既知語の音声認識誤りに対するロバスト性を高めるため,複数の音声認識システムを検索システムに取り入れた.これにより既知語の検索語セットに対する検索性能も大幅に改善することができた.