プレゼンテーションスライド情報の構造抽出

羽山 徹彩  難波 英嗣  國藤 進  

誌名
電子情報通信学会論文誌 D   Vol.J92-D   No.9   pp.1483-1494
発行日: 2009/09/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 特集論文 (知識基盤社会を支える情報技術論文特集)
専門分野: コンテンツ技術・Web情報システム
キーワード: 
情報抽出,  プレゼンテーションスライド,  視覚的レイアウト,  Webデータ,  

本文: PDF(954.4KB)>>
論文を購入




あらまし: 
近年の電子化プレゼンテーションの普及により,講義や会議などの多くの場面で電子的なプレゼンテーション資料(スライド)が利用され,蓄積されてきた.蓄積されたスライドデータは知識資源として膨大となりつつあるため,その高い利活用性が求められている.スライドデータの利活用性を高めるための効果的な方法の一つとして,レイアウトや視覚的効果など人間の理解を促すための有意な構造情報を利用することが挙げられる.しかしながら,そのような構造情報は,スライドデータの中で明確に定義されていないため,計算機で直接的に扱うことが困難である.そこで,本研究ではスライドに含まれる情報からその構造を抽出する手法を提案する.提案手法は,まずスライド上のオブジェクトを"タイトル","図","表","本文","装飾"のいずれかの属性のまとまりに組織化し,それらまとまりをトップダウンに木構造へ組み上げる構造化を行う.評価実験では人手で作成した正解データをもとに,オブジェクトの位置関係に基づいた構造化手法と比較することで,提案手法の有効性を確認した.