F値とは
F値とは、
適合率と再現率はトレードオフの関係になっていて、それぞれの値をバランスよく高くする必要があります。
F値はそのバランスを取るために使う指標です。
適合率と再現率についてはこちらの記事で解説しています。
再現率(recall)とは?分かりやすく図解で解説
この記事を読んで分かること 再現率(recall)とは何か 再現率(recall)の具体的な計算方法 再現率(recall)とは 再現率(recall)とは、 混同行列を使った評価指標の...
適合率(precision)とは?分かりやすく図解で解説
この記事を読んで分かること 適合率(precision)とは何か 適合率(precision)の具体的な計算方法 適合率(precision)とは 適合率(precision)とは、 混...
F値には以下の2種類の計算方法があります。
F1-score
F1-scoreでは適合率と再現率を等価値として評価します。
$$F_1 = \frac{2}{\frac{1}{recall} + \frac{1}{precision}}=\frac{2・reccall ・ precision}{recall+precision} $$
再現率と適合率の調和平均を計算して求めます。
F値が高いほど良いモデルであると判断ができます。
Fβ-score
Fβ-scoreでは再現率をどれ位重視するか調整する係数βを使って、適合率と再現率の重要度を設定できる指標となっています。
$$F_β = \frac{1+β^2}{\frac{β^2}{recall} + \frac{1}{precision}}=\frac{(1+β^2)・reccall ・ precision}{recall+β^2 ・ precision} $$
βに1を設定すると再現率と適合率を同等に評価するF1-scoreと同じ計算式となります。
Fβ-scoreでも値が大きいほど良いモデルであると判断ができます。
まとめ
F値とは、機械学習モデルの評価指標の1つで、適合率と再現率のバランスを取って評価します。
F値にはF1-scoreとFβ-scoreの2種類の計算方法があります。
コメント
F1-scoreの右辺の分子は2*recall*precisionじゃないですかね?
おっしゃる通り2*recall*precisionですね。
ご指摘ありがとうございます。
修正しました。