再現率(recall)とは?分かりやすく図解で解説

スポンサーリンク
ディープラーニング
この記事を読んで分かること
  • 再現率(recall)とは何か
  • 再現率(recall)の具体的な計算方法

 

再現率(recall)とは

再現率(recall)とは、

混同行列を使った評価指標の1つ。
正解データの内、AIが正例だと予測をしたもの割合を表す評価指標

です。

 

$$recall= \frac{本物の内正解したデータ}{本物のデータ}$$で表されます。

再現率(recall)の図

 

本物の内正解したデータは混合行列でいうと真陽性(本物を本物と予測したもの)です。

本物のデータは混合行列でいうと真陽性(本物を本物と予測したもの)と陰性(本物を偽物と予測したもの)です。

 

つまり再現率(recall)は以下の式で表すことができます。

$$recall= \frac{本物の内正解したデータ}{本物のデータ}=\frac{TP}{TP+FN} $$

 

ロボくん
ロボくん
本物の見逃しを少なくしたいときには、再現率(recall)を重視して評価するよ

 

混合行列が分からない場合はこちらの記事で解説しているので、読んでみてください。

混同行列とは?真陽性・偽陰性・偽陽性・真陰性の違いをわかり易く図解で解説
この記事を読んで分かること 混同行列とは何か 真陽性・偽陰性・偽陽性・真陰性の違い 混同行列を使った評価指標にはどんなものがあるのか 混同行列とは 混同行列とは、 2値分類の結果(...

 

再現率(recall)を実際に計算してみる

本物のお札50枚と偽物のお札50枚の計100枚のお札を判定する例を考えてみます。

再現率(recall)の図

 

本物を正しく判断した(TP)が47枚です。

本物のデータ(TP+FN)が50枚です。

そのため、

$$recall= \frac{TP}{TP+FN}  = \frac{47}{47+3}=0.94 $$

となり、再現率(recall)は0.94(94%)です。

 

再現率(recall)は適合率(precision)とトレードオフ

再現率(recall)適合率(precision)トレードオフの関係になっています。

つまり、どちらかの値を高くしようとすると、もう一方の値は低くなります。

逆に、片方の指標を無視すればもう一つの指標は1に近づけることができます。

 

適合率(precision)についてはこちらの記事で説明しています。

適合率(precision)とは?分かりやすく図解で解説
この記事を読んで分かること 適合率(precision)とは何か 適合率(precision)の具体的な計算方法 適合率(precision)とは 適合率(precision)とは、 混...

 

再現率を高くする例

自信のないものは本物と判断するようにAIを設定すれば、再現率(recall)は高くなります。

再現率を高くする

$$recall= \frac{TP}{TP+FN}  = \frac{49}{49+1}=0.98 $$

となり、再現率(recall)は0.98(98%)です。

 

とりあえず本物だと言うAIであれば再現率が高くなります。

 

再現率を低くする例

また、本当に本物か怪しいものは偽物と判断するようにAIを設定すれば、再現率(recall)は低くなります。

再現率を低くする例

$$recall= \frac{TP}{TP+FN}  = \frac{9}{9+41}=0.18 $$

となり、再現率(recall)は0.18(18%)です。

 

絶対に偽物を許さないというAIであれば再現率が低くなります。

 

AIのモデルを評価するときは、再現率(recall)だけの値で評価せず、適合率(precision)とのバランスを考慮したF値などがよく使われます。

 

まとめ

再現率(recall)とは、混同行列を使った評価指標の1つで、正解データの内、AIが正例だと予測をしたもの割合を表す評価指標です。

$$recall= \frac{本物の内正解したデータ}{本物のデータ}=\frac{TP}{TP+FN} $$で表されます。

再現率(recall)と適合率(precision)はトレードオフの関係になっています。

 

参考文献

コメント

タイトルとURLをコピーしました