HMMの変分ベイズ学習によるテキストセグメンテーション及びその映像インデキシングへの応用

越仲 孝文  奥村 明俊  磯谷 亮輔  

誌名
電子情報通信学会論文誌 D   Vol.J89-D   No.9   pp.2113-2122
発行日: 2006/09/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: バイオサイバネティックス,ニューロコンピューティング
キーワード: 
テキスト分割,  隠れマルコフモデル,  パラメータ推定,  ベイズ推定,  

本文: PDF(390.2KB)>>
論文を購入




あらまし: 
近年の大語彙連続音声認識技術の発展により,テキスト処理に基づく情報抽出技術を音声認識結果に適用する試みが多く見られるようになってきている.本論文では,教師なしのテキストセグメンテーション方式を提案する.テキストの生成モデルとしてleft-to-right型隠れマルコフモデル(HMM)を仮定するとき,テキストセグメンテーションは,入力テキストを用いたモデルパラメータ推定とモデル選択の問題として定式化できる.変分ベイズ(VB)法に基づくテキスト分割アルゴリズムを導出し,ベイズ的アプローチがテキストのようなスパースなデータ系列を扱う上で有効に働くことを,ニュース番組の分割実験を通して示す.更に,提案法が調整を必要とする内部パラメータを含まないことから,従来法よりも高い分割精度を安定して達成できることを示す.