ディリクレ過程平均法のレートひずみ理論による解釈

小林 真佐大  渡辺 一帆  

誌名
電子情報通信学会論文誌 A   Vol.J100-A   No.12   pp.475-486
発行日: 2017/12/01
Online ISSN: 1881-0195
論文種別: 論文
専門分野: 情報理論
キーワード: 
クラスタリング,  ディリクレ過程,  レートひずみ曲線,  ひずみ有りデータ圧縮,  

本文: PDF(1017.4KB)
>>論文を購入


あらまし: 
ディリクレ過程平均法はクラスタリングの代表的手法であるK-平均法を拡張した手法であり,クラスタ数をデータから推定することができる.クラスタ数を指定する代わりに,ペナルティパラメータと呼ばれるしきい値を指定する必要があるが,ペナルティパラメータの変化に対するクラスタ数の振る舞いは未だに明らかにされていない.本研究では,ペナルティパラメータとクラスタ数の対数を次元で割った値との組がそれぞれレートひずみ理論における最大ひずみとレートに対応することに着目し,データ数とデータの次元が無限大の極限において,ペナルティパラメータに対応するクラスタ数の曲線がレートひずみ曲線に近づくことを示す.数値実験により,学習データ数が有限であることの影響を受けにくいレートが0の近辺において,レートひずみ曲線に近づくことを確認し,ペナルティパラメータと学習データ中の最大ひずみとの対応を示す.