残差分析で考える(売上予測を重回帰分析で行う手法5)

売上予測 30年の実績

048-711-7195

107-0062 東京都港区南青山2-2-15-942

月~金 9:00~18:00

lv_r

残差分析で考える(売上予測を重回帰分析で行う手法5)

売上予測

2017/11/01 残差分析で考える(売上予測を重回帰分析で行う手法5)

売上予測の手法 その5 重回帰分析を使った売上予測 5 残差分析

 

高精度/売上予測モデルを作るための重回帰分析において、もっとも重要な作業は「残差分析」です。

 

残差分析に始まり、残差分析に終わると言っても過言ではありません。

 

一番最初の残差分析は、最初の説明変数を求めることです。

要するに、単相関の回帰式を作るところです。

 

これは、どんな場合でも、けっこう単純に出てきます。

ただし、いつも同じ項目とは行きません。

 

でも、こういうやり方はけっこう有効です。

というのは、統計データをたくさん並べて置くというやり方です。

たとえば、500m圏、1km圏、2km圏の国勢調査データ、商業統計データなどを沢山用意していて、その中で、目的変数との相関が一番大きい項目の統計データを説明変数にすることです。ただし、データの絶対値が0とか1のようにひじょうにちいさなデータ項目は、たまたま相関が大きくなっただけというのが多いので、気を付けてください。なるべく大きな数字になる統計項目を選ぶべきです。

 

さて、この方法とは別に、最初の説明変数を見つける方法があります。

それは、最大の売上 と 最小の売上を 比べて考えることです。なぜこの店の売上はひじょうに高く、なぜ、こっちの店は小さいのか?

この問いへの答えを数値化することです。

たとえば、最大の売上を示す店が駅に近い、けれども最小の売上を示す店は駅から遠いとしましょう。

そうしたら、駅に近いか遠いかという数値指標を考えれば良いですね。もちろん、これを表す数値で一番簡単なのは”駅から店舗までの距離”でしょう。

 

こうしてまず単相関だけで、回帰式を作ることです。

中学2年生くらいでやったことがあるでしょう。Y=aX+b ですね。

Yは目的変数。Xは説明変数(上の場合だと駅までの距離)、そして、a と b が単相関モデルの係数です。

これは、MSエクセルならば、次のような関数で算出することができます。

a=Slope(目的変数の列、説明変数の列)

b=Intercept(目的変数の列、説明変数の列)

です。

 

さあ、その次に、残差分析が始まります。

単相関モデルでは、各店、実績値-理論値 (これを残差といいます)が出ます。

 

そうしたら、もっとも大きい残差の店、もっとも小さい残差の店を比べるのです。

必ず共通した要因が見つかるとは限りませんので、どちらか一方だけでもいいのです。その要因を見つけましょう。

 

そして、出てきたアイデアこそ、売上予測の中核となる項目になるかもしれません。

2個目の説明変数(候補)が見つかったらさっそく重回帰分析ツールを使って計算してみましょう。

これで、2つとも t値が2以上だったら、説明変数として採用です。

 

とはいえ、今度は別の店舗で 大きな残差が発生しているかもしれませんし、相変わらず 上と同じ店で残差が大きいままになっているかもしれません。

 

売上予測できる重回帰分析とは、残差との戦いと言っても良いほど、長く苦しい戦いです。

download

 

 

TOP