quadratic weighted kappaとは?多クラス分類の評価指標

スポンサーリンク
quadratic weighted kappaとは?ディープラーニング
この記事を読んで分かること
  • quadratic weighted kappaとは何か
  • quadratic weighted kappaの計算方法

 

quadratic weighted kappaとは

quadratic weighted kappaとは、

多クラス分類の評価指標の1つ。
混同行列に重みを付けて評価する指標

です。

 

quadratic weighted kappaクラス間に順序関係があるような場合(例えば、映画の評価を1~5のレーティングで表したもの)に使用されます。

 

具体的な評価式は、

$$QuadraticWeightedKappa= 1 – \frac{\sum _{i,j}w_{i,j}O_{i,j}}{\sum _{i,j}w_{i,j}E_{i,j}}$$

で表されます。

 

変数の意味は以下の通りです。

変数の意味
  • i : 真の値
  • j : 予測値
  • O : 混同行列のレコード数
  • E : 混同行列の期待値
  • W : ペナルティ

 

quadratic weighted kappaの値は、大きいほどAIモデルが良いと判断できます。

完璧な予測をすると1、ランダムな予測をすると0、ランダムよりも悪い予測をすると負の値になります。

 

定義式だけではよくわからないと思うので、具体例を見ていきましょう。

 

quadratic weighted kappaの具体例

写真を見て誰が撮影したか判断するAIを例として考えてみましょう。

quadratic weighted kappaの具体例

 

AIの判定結果が以下のようになったときのquadratic weighted kappaを計算してみます。

 

予測値の混同行列\( O_{i,j} \)
予測値 j合計
123
  真の値
i

 1105520
 2535040
 31502540
合計304030100

 

AIの推測値と真の値の対応を整理したこの混同行列の各カラムが\( O_{i,j} \)となります。

 

次に、ランダムに予測した場合の分布\( E_{i,j} \)を作成します。

予測値の混同行列を見ると、クラス1と予測した枚数が30枚、クラス2と予測した枚数が40枚、クラス3と予測した枚数が30枚です。

このことから、クラス1と予測する確率は30%(30/100)、クラス2と予測する確率は40%(40/100)、クラス3と予測する確率は30%(30/100)と考えることができます。

 

真の値がクラス1である画像20枚をランダムに予測している場合、予測値がクラス1となるのは20×30%で6枚となります。

同様に計算して、ランダムに予測した場合の分布\( E_{i,j} \)は以下のように計算することができます。

 

ランダムな予測の混同行列\( E_{i,j} \)
予測値 j合計
123
  真の値
i

 168620
 212161240
 312161240
合計304030100

 

最後に、ペナルティの係数を設定します。

今回は予測があたっていた場合は0ポイント、クラスが1階級ずれていた場合(クラス1をクラス2と予測した等)は1ポイント、クラスが2階級ずれていた場合(クラス1をクラス3と予測した等)は4ポイントとしました。

表にまとめると以下のようになります。

 

ペナルティの係数\(w_{i,j} \)
予測値 j
123
  真の値
i

 1014
 2101
 3410

 

今まで作った表をもとに定義式に当てはめれば、quadratic weighted kappaを計算することができます。

$$QuadraticWeightedKappa= 1 – \frac{0×10 + 1×5 + 4×5 + …}{0×6 + 1×8 + 4×6 + …} = 1 – \frac{90}{120}=0.25$$

 

まとめ

quadratic weighted kappaとは、多クラス分類の評価指標の1つで、混同行列に重みを付けて評価する指標です。

クラス間に順序関係があるような場合に使用されます。

予測が大きくハズレたものにはペナルティを大きくすることで、評価結果を調整することができる指標となっています。

 

参考文献

コメント

タイトルとURLをコピーしました