文字認識技術を利用した講義動画のスライド同定

武部 浩明  小澤 憲秋  勝山 裕  横田 治夫  直井 聡  

誌名
電子情報通信学会論文誌 D   Vol.J91-D   No.9   pp.2280-2292
発行日: 2008/09/01
Online ISSN: 1881-0225
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 画像・映像処理
キーワード: 
e-Learning,  教育コンテンツ,  動画,  メタデータ,  文字認識,  

本文: PDF(857.8KB)
>>論文を購入


あらまし: 
e-Learningが普及しつつあり,複数のメディアを有機的に統合したe-Learning向け教育コンテンツのニーズが大きくなってきた.講義動画とプレゼンテーション資料のスライドを同期させて再生する講義動画同期コンテンツを作成するためには,講義動画中のスライドが切り換わるタイミングを検出する作業が必要であり,大きなコストがかかっていた.そこで,この問題を解決するために,文字認識技術を用いて,講義動画の各フレームとプレゼンテーション資料の各スライドをオフラインで自動的に同期づける手法を提案する.具体的には,動画の各フレームを文字認識した結果とプレゼンテーション資料のスライドに含まれる文字について,同じ2文字間の関係を同時に満たす文字がどれくらいあるかを表す文字配置に基づく類似度を計算することによりマッチングを行い,スライドを同定する.実際の講義動画に対して本手法を適用し,スライドの同定性能を計測するとともに,本手法によって動画中のスライドが切り換わるタイミングをメタデータとしてもつ動画コンテンツを作成する作業コストを算出した.提案手法を用いることで,高精度にスライドを同定でき,作業コストを大幅に削減できることが分かった.