決定係数(\(R ^{2}\))とは
決定係数(\(R ^{2}\))とは、
です。
具体的には、以下の数式で求めることができます。
決定係数の分子は、各レコードの目的変数の真値と予測値の差の二乗をとります。
分母は、各レコードの目的変数の真値と平均値の差の二乗をとるので予測値の影響を受けません。
決定係数の特徴
決定係数(\(R ^{2}\))は回帰分析の当てはまりの良さを表します。
決定係数は0~1の値を取り、1に近づくほど精度が高いと評価できます。
分子の\(\sum ^{n}_{i=1}\left( y_{i}-\widehat{y}_{i}\right) ^{2}\)が小さいと良いので、RMSEを最小化することと同じ意味です。
決定係数を計算してみる
先に、レコードの平均値(\(\bar{y}\))を求めておきます。
\(\bar{y} = \frac{100 + 150 + 50}{3} \\
\quad = 100
\)
それでは、\(R ^{2}\)を求めていきましょう。
\(R ^{2} = 1 – \frac{(100 – 80) ^{2} + (150 – 110) ^{2} + (50 – 70) ^{2}}{(100 – 100) ^{2} + (150 – 100) ^{2} + (50 – 100) ^{2}} \\
\quad = 1 – \frac{(20) ^{2} + (40) ^{2} + (20) ^{2}}{0 + (50) ^{2} + (-50) ^{2}} \\
\quad = 1 – \frac{400 + 1600 + 400}{0 + 2500 + 2500} \\
\quad = 1 – \frac{12}{25}
\quad = \frac{13}{25}
\)
まとめ
決定係数(\(R ^{2}\))とは、$$R ^{2}=1-\frac{\sum ^{n}_{i=1}\left( y_{i}-\widehat{y}_{i}\right) ^{2}}{\sum ^{n}_{i=1}\left( y_{i}-\bar{y}_{i}\right) ^{2}}$$で表される評価指標です。
回帰分析の当てあまりの良さを表す評価指標で、1に近づくほど精度が高いと判断できます。
コメント