- 正解率(Accuracy)とは何か
- 正解率(Accuracy)の具体的な計算方法
正解率(Accuracy)とは
正解率(Accuracy)とは、
です。
$$accuracy = \frac{正解したデータ}{全データ}$$で表されます。
正しく予測できたものは混合行列でいうと真陽性(本物を本物と予測したもの)と真陰性(偽物を偽物と予測したもの)です。
つまり正解率(Accuracy)は以下の式で表すことができます。
$$accuracy = \frac{正解したデータ}{全データ}=\frac{TP+TN}{TP+TN+FP+FN} $$

混合行列が分からない場合はこちらの記事で解説しているので、読んでみてください。

正解率(Accuracy)を実際に計算してみる
本物のお札50枚と偽物のお札50枚の計100枚のお札を判定する例を考えてみます。
本物(TP)と正しく判断できたものが47枚、偽物(TN)と正しく判断できたものが42枚です。
これらの合計の89枚が正解できたものとなります。
そのため、
$$accuracy = \frac{TP+TN}{TP+TN+FP+FN} = \frac{47+42}{47+42+8+3}=0.89 $$
となり、正解率(Accuracy)は0.89(89%)です。
データが偏っていると正しく評価しづらい
正解率(accuracy)は不均衡なデータ(陽性が90%など)の場合、正しく評価し辛くなります。
例えば、本物が99枚、偽物が1枚の計100枚のお札をAIで分類したときの例を考えてみましょう。
このときの正解率は、
$$accuracy = \frac{TP+TN}{TP+TN+FP+FN} = \frac{95+1}{95+1+0+4}=0.96 $$
となり、正解率(Accuracy)は0.96(96%)です。
一見きちんと評価できているように見えます。
ここで、どんなデータであっても本物と判断するAIについても正解率を計算してみましょう。
$$accuracy = \frac{TP+TN}{TP+TN+FP+FN} = \frac{99+0}{99+0+1+0}=0.99 $$
となり、正解率(Accuracy)は0.99(99%)です。
何も考えずに本物と判断するAI(偽札を一切見抜けないAI)の方が優れているという結果になってしまいました。
このように偏ったデータから算出した正解率だけでAIの良し悪しを検討すると、目的に合わない判断をしてしまうことがあります。
まとめ
正解率(Accuracy)とは、混同行列を使った評価指標の1つで、AIが正しく予測できた割合(全体の何%が正解したのか)を表す評価指標です。
$$accuracy = \frac{正解したデータ}{全データ}$$で表されます。
正解率(accuracy)は不均衡なデータ(陽性が90%など)の場合、正しく評価し辛くなります。























コメント
お世話になっております。
FCマーケティング株式会社メディア事業部の平賀です!
上場企業や占い、クリニック、保険代理店、アダルトなどの企業ドメインで、
サブディレもしくはルート(直URL)を活用したアフィリエイトメディアの運用をお願いできませんか?
弊社はドメイン仲介業を運営しており、
下記のジャンルでのメディア運用を希望されるSEO会社様を探しております。
・金融(クレカ・消費者金融・ファクタリングなど)
・医療
・オリパ
・アダルト
・占い
・宅食
・買取
・マッチングアプリ
・通信教育/知育
・VOD・電子書籍
・レンタルサーバー
・通信
・ペット火葬
・リフォームなど
現在100社以上のSEO会社様・メディア運営者様と提携させて頂いており、
200ドメインほど提供させて頂いております。
月間20~25件の企業ドメインの提携をしており、
貴社の希望にあわせたドメインの営業の代行も可能です。
情報交換だけでも構いませんので、ご興味ございましたら
「興味あり」とご返信ください。
詳細に関して追ってご連絡させていただきます。
ご質問やご不明点などございましたら、お気軽にご連絡くださいませ。
貴社とご一緒できる機会を、心より楽しみにしております。
どうぞよろしくお願い申し上げます。