ワードスポッティングと動的計画法を用いたテレビ番組に対する字幕提示タイミング検出法

丸山 一郎  阿部 芳春  江原 暉将  白井 克彦  

誌名
電子情報通信学会論文誌 D   Vol.J85-D2   No.2   pp.184-192
発行日: 2002/02/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
字幕提示タイミング検出,  自動字幕作成,  ワードスポッティング,  HMM,  動的計画法,  

本文: PDF(576.5KB)>>
論文を購入




あらまし: 
本論文では,事前収録されたテレビ番組に対して番組VTRと事前電子化原稿から聴覚障害者向けの字幕を自動的に付与する技術の中で,音声と字幕の同期タイミングを検出する字幕提示タイミング検出手法について述べている.背景音が重畳している放送音声に対しては,音素HMMワードスポッターだけに基づいたタイミング検出手法では十分な検出精度が得られない.番組の原稿中の各文に対してワードスポッティングにより複数のタイミング候補を検出し,音響的なゆう度に加え三つのスコア(原稿の時間順序,原稿から推定される発声時間との比,音声らしさ)を用いた動的計画法を行い,番組全体として最適なタイミングを選択する手法を提案した.ドキュメンタリー番組 10 回分を対象とした評価実験において,許容検出誤差を1秒とした場合に検出率 99.0%,3秒とした場合に 99.7% の検出精度が得られ,実用的な方式であることが示された.