決定係数とは?具体的な計算方法もわかり易く解説!!

スポンサーリンク
決定係数とは?ディープラーニング
この記事を読んで分かること
  • 決定係数(\(R ^{2}\))とは何か

 

決定係数(\(R ^{2}\))とは

決定係数(\(R ^{2}\))とは、

回帰分析の当てはまりの良さを表す評価指標

です。

 

具体的には、以下の数式で求めることができます。

決定係数の数式

$$R ^{2}=1-\frac{\sum ^{n}_{i=1}\left( y_{i}-\widehat{y}_{i}\right) ^{2}}{\sum ^{n}_{i=1}\left( y_{i}-\bar{y}_{i}\right) ^{2}}$$

  • \(N\):レコード数
  • \(y_i\):レコードの真値
  • \(\widehat{y}_i\):レコードの予測値
  • \(\bar{y}\):レコードの平均値

 

決定係数の分子は、各レコードの目的変数の真値予測値差の二乗をとります。

分母は、各レコードの目的変数の真値平均値差の二乗をとるので予測値の影響を受けません。

 

決定係数の特徴

決定係数(\(R ^{2}\))回帰分析の当てはまりの良さを表します。

決定係数は0~1の値を取り、1に近づくほど精度が高いと評価できます。

分子の\(\sum ^{n}_{i=1}\left( y_{i}-\widehat{y}_{i}\right) ^{2}\)が小さいと良いので、RMSEを最小化することと同じ意味です。

 

決定係数を計算してみる

下の表のデータを元に決定係数(\(R ^{2}\))の計算をしてみます。
 
レコード番号\(i\)真値\(y_i\)予測値\(\widehat{y}_i\)
110080
2150110
35070

 

先に、レコードの平均値(\(\bar{y}\))を求めておきます。

\(\bar{y} = \frac{100 + 150 + 50}{3} \\
\quad = 100
\)

 

それでは、\(R ^{2}\)を求めていきましょう。

\(R ^{2} = 1 – \frac{(100 – 80) ^{2} + (150 – 110) ^{2} + (50 – 70) ^{2}}{(100 – 100) ^{2} + (150 – 100) ^{2} + (50 – 100) ^{2}} \\
\quad = 1 – \frac{(20) ^{2} + (40) ^{2} + (20) ^{2}}{0 + (50) ^{2} + (-50) ^{2}} \\
\quad = 1 – \frac{400 + 1600 + 400}{0 + 2500 + 2500} \\
\quad = 1 – \frac{12}{25}
\quad = \frac{13}{25}
\)

 

まとめ

決定係数(\(R ^{2}\))とは、$$R ^{2}=1-\frac{\sum ^{n}_{i=1}\left( y_{i}-\widehat{y}_{i}\right) ^{2}}{\sum ^{n}_{i=1}\left( y_{i}-\bar{y}_{i}\right) ^{2}}$$で表される評価指標です。

回帰分析の当てあまりの良さを表す評価指標で、1に近づくほど精度が高いと判断できます。

 

参考文献

コメント

タイトルとURLをコピーしました