この記事を読んで分かること
- RMSE(平均平方二乗誤差)とは何か
RMSE(平均平方二乗誤差)とは
RMSE(平均平方二乗誤差)とは、
です。
変数の定義
- \(N\):レコード数
- \(y_i\):レコードの真値
- \(\widehat{y}_i\):レコードの予測値
各レコードの目的変数の真値と予測値の差の二乗をとり、それらを平均した後に平方根を計算します。
下の表のデータを元にRMSEの計算をしてみます。
レコード番号\(i\) | 真値\(y_i\) | 予測値\(\widehat{y}_i\) |
1 | 100 | 80 |
2 | 150 | 110 |
3 | 70 | 50 |
\(RMSE = \sqrt{\frac{1}{3}\{\left( 100-80\right) ^{2} + \left( 150-110\right) ^{2} + \left( 70-50\right) ^{2}\}} \\
\qquad\quad = \sqrt{\frac{1}{3}\left(400 + 1600 + 400\right)} \\
\qquad\quad = \sqrt{800}
\)
RMSE(平均平方二乗誤差)は回帰タスクで使われる代表的な評価指標です。
RMSE(平均平方二乗誤差)外れ値の影響を受けやすいので、前処理で外れ値を除いておくなどの工夫が必要になります。
まとめ
RMSE(平均平方二乗誤差)とは、\(RMSE=\sqrt{\frac{1}{N}\sum ^{n}_{i=1}\left( y_{i}-\widehat{y}_{i}\right) ^{2}}\)で表される評価指標です。
RMSE(平均平方二乗誤差)は回帰タスクで使われる代表的な評価指標です。
コメント