混合ガウスモデル(Gaussian Mixture Model)とは?

スポンサーリンク
混合ガウスモデル(Gaussian Mixture Model)とは基礎知識
この記事を読んで分かること
  • 混合ガウスモデルとは何か

 

混合ガウスモデル(Gaussian Mixture Model)とは

混合ガウスモデルとは、

クラスタリングの手法の1つで、データが複数の正規分布(ガウス分布)から生成されたと考えて分析する手法

です。

 

データを正規分布の重ね合わせだとみなす

 

与えられたデータが、3つの正規分布を重ねあわせで表現されています。

混合ガウスモデルでは、それぞれの正規分布の平均と分散を変化させて、どの正規分布に属するかを推定していくことになります。

 

混合ガウスモデルのアルゴリズム

混合ガウスモデルでは、データ点からガウス分布のパラメータを求めるものとなります。

クラス数は人間が手動で設定するパラメータとなっています。

 

具体的な手順は以下のとおりです。

混合ガウスモデルの手順
    • ステップ1
      ガウス分布のパラメータを初期化する
    • ステップ2
      データ点が持つ重みを各クラスごとに計算する
    • ステップ3
      得られた重みからパラメータを再計算する
    • ステップ4
      更新されたパラメータの変化が十分小さくなるまでステップ2,3を繰り返す

ステップ1 : ガウス分布のパラメータを初期化する

まず、それぞれの正規分布のパラメータ(平均と分散)を初期値に設定します。

混合ガウスモデル_初期値の適用

 

ステップ2 : データ点が持つ重みを各クラスタごとに計算する

データ点が各正規分布(クラスタ)に属する確率(重み)を計算します。

 

重みを求める計算式は、

$$ p(j | x) = \frac{π_j p_j (x)}{\sum{π_j p_j (x)}}$$

となります。

 

ここでの各変数の意味は以下のとおりです。

変数の定義
  •  \(j\) : 属するクラスタ
  • \(π_j\) : jクラスタに所属する確率
  •  \( p_j (x)\) : jクラスタに所属する確率密度関数

 

混合ガウスモデル_重みの計算

 

このデータ点の重みは

$$ p(A | x) = \frac{0.02}{0.10 + 0.02}$$

$$ p(B | x) = \frac{0.10}{0.10 + 0.02}$$

と計算できます。

 

ステップ3 : 得られた重みからパラメータを再計算する

ステップ2ですべてのデータ点に対して重みを求められたので、各クラスタごとにその平均と分散を計算します。

計算した平均と分散からガウス分布を再計算します。

混合ガウスモデル_ガウス分布の再計算

 

 

そうして求められた新しいガウス分布でステップ2を実施して、学習を繰り返していきます。

 

 

まとめ

混合ガウスモデルとは、クラスタリングの手法の1つで、データが複数の正規分布(ガウス分布)から生成されたと考えて分析する手法です。

混合ガウスモデルでは、それぞれの正規分布の平均と分散を変化させて、どの正規分布に属するかを推定していくことになります。

参考文献

 

コメント

タイトルとURLをコピーしました