半構造データからのマイニングとHMMを用いた情報抽出による知識の相互利用

丸山 紘平
上原 邦昭

誌名
電子情報通信学会論文誌 D   Vol.J85-D1    No.11    pp.1057-1066
発行日: 2002/11/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1915
論文種別: 論文
専門分野: データベース
キーワード: 
データマイニング,  情報抽出,  相関ルール,  HMM,  半構造データ,  

本文: PDF(724.2KB)>>
論文を購入



あらまし: 
本論文では,データマイニング技術の一つである相関ルール抽出とHMMを用いた情報抽出の間で知識の相互利用を行う手法を提案する.従来の相関ルール抽出手法では,主に構造化データを対象としており,正確なスキーマ情報の欠如したデータに適用することは非効率若しくは不可能であった.本論文では,HMMを用いた情報抽出によってテキストデータ中の各単語の属性を認識して,タグ付けを行い構造化している.更に,構造化されたテキストデータから抽出された相関ルールが示す単語の関連性の度合によって,HMMのパラメータに重みを付け,情報抽出の認識精度を改善して,データマイニングと情報抽出の間で知識の相互利用を可能にしている.また,タグ付けされたデータやBibTeXデータなどの半構造データ群から,Schema Discoveryによって発見された典型的なスキーマパターンを利用したマイニング手法を提案する.