講義音声ドキュメントのコンテンツ化と視聴システム

中川 聖一  富樫 慎吾  山口 優  藤井 康寿  北岡 教英  

誌名
電子情報通信学会論文誌 D   Vol.J91-D   No.2   pp.238-249
発行日: 2008/02/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (教育システムにおけるプラットホームとコンテンツ開発論文特集)
専門分野: 
キーワード: 
講義音声,  音声認識,  音声要約,  インデクシング,  視聴システム,  

本文: PDF(531.6KB)>>
論文を購入




あらまし: 
本論文では,大学院における講義音声を対象として行った音声自動書き起こし,自動要約,及びセグメンテーション/インデクシングといった一連の処理と,それらを統合した講義教材コンテンツと視聴システムについて述べる.これらは視聴者が,動画や音声といったいわゆるマルチメディア情報をより効率良く利用できるようにするために不可欠な技術である.講義音声においては,ビデオ映像とあわせて要約やインデックスを付加することによって,利用者の学習効率の向上が見込まれる.我々はまず,講義を録音する際に問題となる収録方法が認識性能に及ぼす影響を調べた.その結果,収録方法の違いによって,単語認識精度に最大23%の差が現れることが分かった.音声認識結果を利用した要約実験では,κ値で0.319~0.456という結果が得られ,人間による要約の0.407~0.477と比べ近い結果が得られた.最後に,認識,要約に加えて,自動セグメンテーション,インデクシングの結果を利用した講義の教材コンテンツ化を行い,従来と比較して効率良く学習ができる評価を得た.