残差分析で考える（売上予測を重回帰分析で行う手法5）

048-711-7195

107-0062 東京都港区南青山2-2-15-942

月～金 9:00～18:00

残差分析で考える（売上予測を重回帰分析で行う手法5）

売上予測

2017/11/01 残差分析で考える（売上予測を重回帰分析で行う手法5）

売上予測の手法　その5　重回帰分析を使った売上予測　5　残差分析

高精度/売上予測モデルを作るための重回帰分析において、もっとも重要な作業は「残差分析」です。

残差分析に始まり、残差分析に終わると言っても過言ではありません。

一番最初の残差分析は、最初の説明変数を求めることです。

要するに、単相関の回帰式を作るところです。

これは、どんな場合でも、けっこう単純に出てきます。

ただし、いつも同じ項目とは行きません。

でも、こういうやり方はけっこう有効です。

というのは、統計データをたくさん並べて置くというやり方です。

たとえば、500ｍ圏、1ｋｍ圏、2ｋｍ圏の国勢調査データ、商業統計データなどを沢山用意していて、その中で、目的変数との相関が一番大きい項目の統計データを説明変数にすることです。ただし、データの絶対値が0とか1のようにひじょうにちいさなデータ項目は、たまたま相関が大きくなっただけというのが多いので、気を付けてください。なるべく大きな数字になる統計項目を選ぶべきです。

さて、この方法とは別に、最初の説明変数を見つける方法があります。

それは、最大の売上　と　最小の売上を　比べて考えることです。なぜこの店の売上はひじょうに高く、なぜ、こっちの店は小さいのか？

この問いへの答えを数値化することです。

たとえば、最大の売上を示す店が駅に近い、けれども最小の売上を示す店は駅から遠いとしましょう。

そうしたら、駅に近いか遠いかという数値指標を考えれば良いですね。もちろん、これを表す数値で一番簡単なのは”駅から店舗までの距離”でしょう。

こうしてまず単相関だけで、回帰式を作ることです。

中学2年生くらいでやったことがあるでしょう。Y＝aX+ｂ　ですね。

Yは目的変数。Xは説明変数（上の場合だと駅までの距離）、そして、a　と　ｂ　が単相関モデルの係数です。

これは、MSエクセルならば、次のような関数で算出することができます。

a＝Slope（目的変数の列、説明変数の列）

b＝Intercept（目的変数の列、説明変数の列）

です。