パーセプトロンとは?図解で分かりやすく解説!!

訓練データと検証データとテストデータの違い!!機械学習におけるデータセットの分割を解説

ランダムフォレスト(Random forest)とは?機械学習モデルを分かりやすく解説!!

全結合層とは?DeepLearningの基本的なモデルを解説

【TensorFlow】GPUが認識されているか確認する方法

kNN(k-Nearest Neighbor method)とは?k近傍法を分かりやすく解説!!

GBDT(勾配ブースティング木)とは？図解で分かりやすく説明

主成分分析(PCA)とは？図解で分かりやすく解説

ソフトマックス関数(softmax関数)とは?機械学習の視点で分かりやすく解説!!

【線形代数】特異値分解とは?例題付きで分かりやすく解説!!

【Ubuntu】蓋を閉じてもノートPCをスリープにしない方法

k-means法とは？図解で分かりやすく解説!!

カーネル法(Kernel method)とは？次元を変えて分かりやすくするテクニック!!

バイアス・バリアンスとは?図解で分かりやすく数式まで徹底解説!!

決定木とは？不純度の計算も分かりやすく解説

【Ubuntu】nvidia-driverのインストール方法をわかり易く解説

勾配降下法とは?分かりやすく図解で解説

転置畳み込みは(逆畳み込み)とは?画像生成に使われる手法を分かりやすく解説

誤答率(error rate)とは？分かりやすく図解で解説

スポンサーリンク

ディープラーニング

2022.03.22

この記事を読んで分かること

誤答率(error rate)とは何か
誤答率(error rate)の具体的な計算方法

目次

誤答率(error rate)とは
誤答率(error rate)を実際に計算してみる
データが偏っていると正しく評価しづらい
まとめ
参考文献

誤答率(error rate)とは

誤答率(error rate)とは、

混同行列を使った評価指標の1つ。

AIが誤った予測をした割合(全体の何%を間違えたのか)を表す評価指標

です。

$$error= \frac{間違えたデータ}{全データ}$$で表されます。

間違えて予測したものは混合行列でいうと偽陽性(偽物を本物と予測したもの)と偽陰性(本物を偽物と予測したもの)です。

つまり誤答率(error rate)は以下の式で表すことができます。

$$error= \frac{間違えたデータ}{全データ}=\frac{FP+FN}{TP+TN+FP+FN} $$

ロボくん

ロボくん

間違えた割合だから、1-正解率(Accuracy)でも求めることができるよ。

混合行列が分からない場合はこちらの記事で解説しているので、読んでみてください。

混同行列とは？真陽性・偽陰性・偽陽性・真陰性の違いをわかり易く図解で解説

この記事を読んで分かること混同行列とは何か真陽性・偽陰性・偽陽性・真陰性の違い混同行列を使った評価指標にはどんなものがあるのか混同行列とは混同行列とは、 2値分類の結果(...

誤答率(error rate)を実際に計算してみる

本物のお札50枚と偽物のお札50枚の計100枚のお札を判定する例を考えてみます。

偽物を本物として誤って判断した(FP)が8枚、本物を偽物として誤って判断したもの(FN)が3枚です。

これらの合計の11枚が間違えたものとなります。

そのため、

$$error= \frac{FP+FN}{TP+TN+FP+FN} = \frac{8+3}{47+42+8+3}=0.11 $$

となり、誤答率(error rate)は0.11(11%)です。

データが偏っていると正しく評価しづらい

誤答率(error rate)は不均衡なデータ(陽性が90%など)の場合、正しく評価し辛くなります。

例えば、本物が99枚、偽物が1枚の計100枚のお札をAIで分類したときの例を考えてみましょう。

このときの誤答率(error rate)は、

$$error= \frac{FP+FN}{TP+TN+FP+FN} = \frac{0+4}{95+4+0+1}=0.04 $$

となり、誤答率(error rate)は0.04(4%)です。

一見きちんと評価できているように見えます。

ここで、どんなデータであっても本物と判断するAIについても正解率を計算してみましょう。

$$error= \frac{FP+FN}{TP+TN+FP+FN} = \frac{1+0}{99+0+1+0}=0.01 $$

となり、誤答率(error rate)は0.01(1%)です。

何も考えずに本物と判断するAI(偽札を一切見抜けないAI)の方が優れているという結果になってしまいました。

このように偏ったデータから算出した誤答率だけでAIの良し悪しを検討すると、目的に合わない判断をしてしまうことがあります。

まとめ

誤答率(error rate)とは、混同行列を使った評価指標の1つで、AIが誤った予測をした割合(全体の何%を間違えたのか)を表す評価指標です。

$$error= \frac{間違えたデータ}{全データ}$$で表されます。

また、1-正解率(Accuracy)でも求めることができます。

誤答率(error rate)は不均衡なデータ(陽性が90%など)の場合、正しく評価し辛くなります。

参考文献

Kaggleで勝つデータ分析の技術

created by Rinker

コメント

タイトルとURLをコピーしました