読みやすい字幕生成のための講演テキストへの改行挿入

村田 匡輝  大野 誠寛  松原 茂樹  

誌名
電子情報通信学会論文誌 D   Vol.J92-D   No.9   pp.1621-1631
発行日: 2009/09/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 自然言語処理
キーワード: 
音声言語,  リアルタイム字幕生成,  係り受け構造,  節境界,  音声コーパス,  

本文: PDF(749.4KB)
>>論文を購入


あらまし: 
リアルタイム字幕生成とは,講演や解説などの音声をテキストで提示するものであり,聴覚障害者や高齢者,外国人らによる講演音声の理解を支援するための技術である.講演では一文が長くなる傾向にあり,多くの文がスクリーン上で複数行にまたがって表示されることになるため,テキストが読みやすくなる位置に改行が挿入されている必要がある.本論文では,読みやすい字幕を生成するための要素技術として,日本語講演文への改行挿入手法を提案する.本手法では,係り受け,節境界やポーズ,行長などの情報に基づき,統計的手法によって改行位置を決定する.日本語講演データの1,714文を使用した実験では,改行挿入の再現率で82.66%,適合率で80.24%を達成し,本手法の有効性を確認した.