話題混合モデルによる放送ニュースからの話題抽出

今井 亨  リチャード シュワルツ  小林 彰夫  安藤 彰男  

誌名
電子情報通信学会論文誌 D   Vol.J81-D2   No.9   pp.1955-1964
発行日: 1998/09/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
話題抽出,  HMM,  放送ニュース,  音声認識,  

本文: PDF(722.8KB)>>
論文を購入




あらまし: 
放送ニュースの音声やテキストからの話題抽出は,ストーリーの分類や検索,大語い連続音声認識における言語的制約への利用などが期待できる.本論文では,話題抽出のための話題混合モデルを提案し,数千の話題を対象にして,放送ニュースの各ストーリーから関連する複数の話題を同時に抽出することを試みる.話題混合モデルは,話題がストーリー中の単語ごとに遷移し,それぞれの単語出力確率に従って単語を出力していくというモデルである.話題混合モデルは一種のHMMであり,EMアルゴリズムによって,各話題はその話題と関連性の深い単語(キーワード)をより多く出力するように学習される.話題抽出で問題となる,どの話題にも出現しやすい一般単語は,モデルに加えられた特別な話題によって吸収される.英語と日本語ニュースのテキストおよび音声認識結果を入力とした話題抽出実験において,話題混合モデルは従来モデルよりも高い話題適合率を示した.