音声情報と画像情報の併用による商品紹介映像のセグメンテーション

藤本 雅清  有木 康雄  松本 宏  

誌名
電子情報通信学会論文誌 D   Vol.J89-D   No.2   pp.292-304
発行日: 2006/02/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
映像の区間分割,  音声認識,  音声認識辞書の自動生成,  テロップ文字認識,  

本文: PDF(587KB)>>
論文を購入




あらまし: 
本研究では,社内で製作された商品の紹介映像を対象とした,個々の商品区間へ分割するとともに商品名を索引として付与するシステムを提案する.本研究におけるシステムでは,商品紹介映像に含まれる音声を認識することにより抽出された重要単語(商品名)を用いて,映像の分割と索引の付与を行う.音声認識により商品名を抽出するには,音声認識用の辞書に商品名が事前に登録されている必要がある.しかし多くの場合,対象としている映像にどのような商品が含まれているかということは事前には未知である.このため本研究では,映像中に出現するテロップ文字を認識して商品名の候補を自動的に抽出し,音声認識によって商品名を確定する方法を採用する.つまり本手法は,音声情報と映像情報を併用した映像分割手法であり,それぞれの情報を単独で用いる場合に比べて,わき出しを削減し,高い分割精度を得ることができる.