連結成分と領域の分類に基づいた漫画における文字領域の検出

荒巻 祐治  松井 勇佑  山崎 俊彦  相澤 清晴  
(ヒューマンコミュニケーション基礎研究専門委員会推薦論文)

誌名
電子情報通信学会論文誌 A   Vol.J100-A   No.1   pp.3-11
発行日: 2017/01/01
Online ISSN: 1881-0195
論文種別: 特集論文 (ヒューマンコミュニケーション〜ヒト・モノ・コトのつながりをデザインするコミュニケーション技術〜論文特集)
専門分野: 
キーワード: 
漫画,  文字領域,  検出,  連結成分,  深層特徴量,  

本文: PDF(2.7MB)
>>論文を購入


あらまし: 
本論文は,漫画のページ画像から文字を含む領域を検出することを目的とする.そのために,幾何特徴を用いて分類した連結成分を統合することで効率的に候補領域を生成し,それらの候補領域を判別能力の高い深層特徴によって再度分類することで誤検出を除去する手法を提案する.更に,この手法で用いる機械学習や大規模で定量的な評価を可能にするため,多様な漫画のページ画像に文字領域の位置,種類,文字列を付与したデータセットを構築した.このデータセットに対する評価実験により,提案した検出手法が従来の手法よりも高いF値0.466を達成することを確認した.漫画から文字情報を抽出することは,文字を用いた検索や文脈を理解した処理,他言語への自動翻訳などの応用につながることが期待される.