音声情報を統合したプレゼンテーションコンテンツ検索

岡本 拓明  仲野 亘  小林 隆志  直井 聡  横田 治夫  岩野 公司  古井 貞煕  

誌名
電子情報通信学会論文誌 D   Vol.J90-D   No.2   pp.209-222
発行日: 2007/02/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (データ工学論文特集)
専門分野: 情報検索
キーワード: 
e-learning,  情報検索,  情報統合,  音声情報,  音声認識,  

本文: PDF(915.1KB)>>
論文を購入




あらまし: 
我々は,講義・講演のビデオとその中で使われたスライドをメタデータによりプレゼンテーションコンテンツとして蓄積するとともに,そのプレゼンテーションコンテンツの特性を考慮したシーン検索機能を有するUPRISE(Unified Presentation slide Retrieval by Impression Search Engine) を提案してきた.これまでUPRISEでは,スライド構造やスライドの提示時間,前後のシーンのコンテクストなどをその検索機能に利用してきた.本論文では,シーン検索の精度を向上させることを目的に,講義・講演ビデオ中の音声情報を,これまでのUPRISEの検索機能に統合する.講義ビデオから音声認識によって音声情報を抽出し,その音声情報のコンテクストへの影響を考慮した4種類の統合手法と,音声情報の特定性を考慮した統合方法を提案する.更に,実際の講義コンテンツを用いた実験によりそれらの効果を評価する.