混合ガウスモデル(Gaussian Mixture Model)とは
混合ガウスモデルとは、
です。
与えられたデータが、3つの正規分布を重ねあわせで表現されています。
混合ガウスモデルでは、それぞれの正規分布の平均と分散を変化させて、どの正規分布に属するかを推定していくことになります。
混合ガウスモデルのアルゴリズム
混合ガウスモデルでは、データ点からガウス分布のパラメータを求めるものとなります。
クラス数は人間が手動で設定するパラメータとなっています。
具体的な手順は以下のとおりです。
混合ガウスモデルの手順
- ステップ1ガウス分布のパラメータを初期化する
- ステップ2データ点が持つ重みを各クラスごとに計算する
- ステップ3得られた重みからパラメータを再計算する
- ステップ4更新されたパラメータの変化が十分小さくなるまでステップ2,3を繰り返す
ステップ1 : ガウス分布のパラメータを初期化する
まず、それぞれの正規分布のパラメータ(平均と分散)を初期値に設定します。
ステップ2 : データ点が持つ重みを各クラスタごとに計算する
データ点が各正規分布(クラスタ)に属する確率(重み)を計算します。
重みを求める計算式は、
$$ p(j | x) = \frac{π_j p_j (x)}{\sum{π_j p_j (x)}}$$となります。
ここでの各変数の意味は以下のとおりです。
このデータ点の重みは
$$ p(A | x) = \frac{0.02}{0.10 + 0.02}$$ $$ p(B | x) = \frac{0.10}{0.10 + 0.02}$$と計算できます。
ステップ3 : 得られた重みからパラメータを再計算する
ステップ2ですべてのデータ点に対して重みを求められたので、各クラスタごとにその平均と分散を計算します。
計算した平均と分散からガウス分布を再計算します。
そうして求められた新しいガウス分布でステップ2を実施して、学習を繰り返していきます。
まとめ
混合ガウスモデルとは、クラスタリングの手法の1つで、データが複数の正規分布(ガウス分布)から生成されたと考えて分析する手法です。
混合ガウスモデルでは、それぞれの正規分布の平均と分散を変化させて、どの正規分布に属するかを推定していくことになります。
参考文献
コメント