正解率(Accuracy)とは?分かりやすく図解で解説

スポンサーリンク
正解率(Accuracy)とは?ディープラーニング
この記事を読んで分かること
  • 正解率(Accuracy)とは何か
  • 正解率(Accuracy)の具体的な計算方法

 

正解率(Accuracy)とは

正解率(Accuracy)とは、

混同行列を使った評価指標の1つ。
AIが正しく予測できた割合(全体の何%が正解したのか)を表す評価指標

です。

 

$$accuracy = \frac{正解したデータ}{全データ}$$で表されます。

真陽性と真陰性

 

正しく予測できたものは混合行列でいうと真陽性(本物を本物と予測したもの)と真陰性(偽物を偽物と予測したもの)です。

つまり正解率(Accuracy)は以下の式で表すことができます。

$$accuracy = \frac{正解したデータ}{全データ}=\frac{TP+TN}{TP+TN+FP+FN} $$

 

ロボくん
ロボくん
直感的に理解しやすい評価指標ですね。

 

混合行列が分からない場合はこちらの記事で解説しているので、読んでみてください。

混同行列とは?真陽性・偽陰性・偽陽性・真陰性の違いをわかり易く図解で解説
この記事を読んで分かること 混同行列とは何か 真陽性・偽陰性・偽陽性・真陰性の違い 混同行列を使った評価指標にはどんなものがあるのか 混同行列とは 混同行列とは、 2値分類の結果(...

 

正解率(Accuracy)を実際に計算してみる

本物のお札50枚と偽物のお札50枚の計100枚のお札を判定する例を考えてみます。

真陽性と真陰性

 

本物(TP)と正しく判断できたものが47枚、偽物(TN)と正しく判断できたものが42枚です。

これらの合計の89枚が正解できたものとなります。

そのため、

$$accuracy = \frac{TP+TN}{TP+TN+FP+FN}  = \frac{47+42}{47+42+8+3}=0.89 $$

となり、正解率(Accuracy)は0.89(89%)です。

 

データが偏っていると正しく評価しづらい

正解率(accuracy)は不均衡なデータ(陽性が90%など)の場合、正しく評価し辛くなります。

例えば、本物が99枚、偽物が1枚の計100枚のお札をAIで分類したときの例を考えてみましょう。

データが偏っているときの正解率(Accuracy)

 

このときの正解率は、

$$accuracy = \frac{TP+TN}{TP+TN+FP+FN}  = \frac{95+1}{95+1+0+4}=0.96 $$

となり、正解率(Accuracy)は0.96(96%)です。

 

一見きちんと評価できているように見えます。

ここで、どんなデータであっても本物と判断するAIについても正解率を計算してみましょう。

$$accuracy = \frac{TP+TN}{TP+TN+FP+FN}  = \frac{99+0}{99+0+1+0}=0.99 $$

となり、正解率(Accuracy)は0.99(99%)です。

 

何も考えずに本物と判断するAI(偽札を一切見抜けないAI)の方が優れているという結果になってしまいました。

このように偏ったデータから算出した正解率だけでAIの良し悪しを検討すると、目的に合わない判断をしてしまうことがあります。

 

まとめ

正解率(Accuracy)とは、混同行列を使った評価指標の1つで、AIが正しく予測できた割合(全体の何%が正解したのか)を表す評価指標です。

$$accuracy = \frac{正解したデータ}{全データ}$$で表されます。

正解率(accuracy)は不均衡なデータ(陽性が90%など)の場合、正しく評価し辛くなります。

 

参考文献

コメント

タイトルとURLをコピーしました