- 再現率(recall)とは何か
- 再現率(recall)の具体的な計算方法
再現率(recall)とは
再現率(recall)とは、
です。
$$recall= \frac{本物の内正解したデータ}{本物のデータ}$$で表されます。
本物の内正解したデータは混合行列でいうと真陽性(本物を本物と予測したもの)です。
本物のデータは混合行列でいうと真陽性(本物を本物と予測したもの)と偽陰性(本物を偽物と予測したもの)です。
つまり再現率(recall)は以下の式で表すことができます。
$$recall= \frac{本物の内正解したデータ}{本物のデータ}=\frac{TP}{TP+FN} $$

混合行列が分からない場合はこちらの記事で解説しているので、読んでみてください。

再現率(recall)を実際に計算してみる
本物のお札50枚と偽物のお札50枚の計100枚のお札を判定する例を考えてみます。
本物を正しく判断した(TP)が47枚です。
本物のデータ(TP+FN)が50枚です。
そのため、
$$recall= \frac{TP}{TP+FN} = \frac{47}{47+3}=0.94 $$
となり、再現率(recall)は0.94(94%)です。
再現率(recall)は適合率(precision)とトレードオフ
再現率(recall)は適合率(precision)とトレードオフの関係になっています。
つまり、どちらかの値を高くしようとすると、もう一方の値は低くなります。
逆に、片方の指標を無視すればもう一つの指標は1に近づけることができます。
適合率(precision)についてはこちらの記事で説明しています。

再現率を高くする例
自信のないものは本物と判断するようにAIを設定すれば、再現率(recall)は高くなります。
$$recall= \frac{TP}{TP+FN} = \frac{49}{49+1}=0.98 $$
となり、再現率(recall)は0.98(98%)です。
とりあえず本物だと言うAIであれば再現率が高くなります。
再現率を低くする例
また、本当に本物か怪しいものは偽物と判断するようにAIを設定すれば、再現率(recall)は低くなります。
$$recall= \frac{TP}{TP+FN} = \frac{9}{9+41}=0.18 $$
となり、再現率(recall)は0.18(18%)です。
絶対に偽物を許さないというAIであれば再現率が低くなります。
AIのモデルを評価するときは、再現率(recall)だけの値で評価せず、適合率(precision)とのバランスを考慮したF値などがよく使われます。
まとめ
再現率(recall)とは、混同行列を使った評価指標の1つで、正解データの内、AIが正例だと予測をしたもの割合を表す評価指標です。
$$recall= \frac{本物の内正解したデータ}{本物のデータ}=\frac{TP}{TP+FN} $$で表されます。
再現率(recall)と適合率(precision)はトレードオフの関係になっています。
コメント