ワープロ型と行単位型融合によるハイブリッド字幕編集システム

宮本 晃太郎  荒川 健一  斉藤 隆  

誌名
電子情報通信学会論文誌 D   Vol.J90-D   No.3   pp.673-682
発行日: 2007/03/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (情報福祉論文特集)
専門分野: 聴覚補助
キーワード: 
アクセシビリティ,  字幕編集,  音声認識,  ディジタルコンテンツ,  認識率,  

本文: PDF(647.1KB)>>
論文を購入




あらまし: 
字幕が付与されていないディジタルアーカイブコンテンツが数多く存在する.アクセシビリティの重要性をかんがみて,こういったコンテンツに対して,音声をもとに字幕を付与することは極めて重要である.ただし,字幕の付与は人手による長時間の編集作業を要求する.我々は先に,音声認識を利用した字幕編集方式として,従来のワープロ型編集に比べ,認識誤りを含む字幕編集における一連の作業の効率化を意図した機能追加が容易な,行単位型を提案した.ところが,行単位型は高い認識率に対する有効性が認められるものの,認識率の低い部分の操作性に課題があることが分かってきた.本論文では,まずディジタルコンテンツにおける認識率のばらつきに着目し,実際のコンテンツにおける認識率のばらつきを調査する予備実験を行った.その結果,コンテンツ間の認識率のばらつきは大きく,更に,同一のコンテンツ内においても認識率のばらつきは予想以上に大きいことが分かった.これらの点を踏まえ,本論文では,音声認識率の変動にも処理効率が影響されにくいような,ワープロ型と行単位型を融合したハイブリッド字幕編集システムを提案する.編集効率に対する実験の結果,本システムによって従来の編集方式を上回る効果が見られた.