048-711-7195
107-0062 東京都港区南青山2-2-15-942
月~金 9:00~18:00
残差分析で考える(売上予測を重回帰分析で行う手法5)
売上予測の手法 その5 重回帰分析を使った売上予測 5 残差分析
高精度/売上予測モデルを作るための重回帰分析において、もっとも重要な作業は「残差分析」です。
残差分析に始まり、残差分析に終わると言っても過言ではありません。
一番最初の残差分析は、最初の説明変数を求めることです。
要するに、単相関の回帰式を作るところです。
これは、どんな場合でも、けっこう単純に出てきます。
ただし、いつも同じ項目とは行きません。
でも、こういうやり方はけっこう有効です。
というのは、統計データをたくさん並べて置くというやり方です。
たとえば、500m圏、1km圏、2km圏の国勢調査データ、商業統計データなどを沢山用意していて、その中で、目的変数との相関が一番大きい項目の統計データを説明変数にすることです。ただし、データの絶対値が0とか1のようにひじょうにちいさなデータ項目は、たまたま相関が大きくなっただけというのが多いので、気を付けてください。なるべく大きな数字になる統計項目を選ぶべきです。
さて、この方法とは別に、最初の説明変数を見つける方法があります。
それは、最大の売上 と 最小の売上を 比べて考えることです。なぜこの店の売上はひじょうに高く、なぜ、こっちの店は小さいのか?
この問いへの答えを数値化することです。
たとえば、最大の売上を示す店が駅に近い、けれども最小の売上を示す店は駅から遠いとしましょう。
そうしたら、駅に近いか遠いかという数値指標を考えれば良いですね。もちろん、これを表す数値で一番簡単なのは”駅から店舗までの距離”でしょう。
こうしてまず単相関だけで、回帰式を作ることです。
中学2年生くらいでやったことがあるでしょう。Y=aX+b ですね。
Yは目的変数。Xは説明変数(上の場合だと駅までの距離)、そして、a と b が単相関モデルの係数です。
これは、MSエクセルならば、次のような関数で算出することができます。
a=Slope(目的変数の列、説明変数の列)
b=Intercept(目的変数の列、説明変数の列)
です。
さあ、その次に、残差分析が始まります。
単相関モデルでは、各店、実績値-理論値 (これを残差といいます)が出ます。
そうしたら、もっとも大きい残差の店、もっとも小さい残差の店を比べるのです。
必ず共通した要因が見つかるとは限りませんので、どちらか一方だけでもいいのです。その要因を見つけましょう。
そして、出てきたアイデアこそ、売上予測の中核となる項目になるかもしれません。
2個目の説明変数(候補)が見つかったらさっそく重回帰分析ツールを使って計算してみましょう。
これで、2つとも t値が2以上だったら、説明変数として採用です。
とはいえ、今度は別の店舗で 大きな残差が発生しているかもしれませんし、相変わらず 上と同じ店で残差が大きいままになっているかもしれません。
売上予測できる重回帰分析とは、残差との戦いと言っても良いほど、長く苦しい戦いです。
23/06/12
22/05/20
21/12/30
21/08/04
21/08/03
21/08/01
21/07/31
21/07/10
21/07/09
21/07/08
TOP
売上予測の手法 その5 重回帰分析を使った売上予測 5 残差分析
高精度/売上予測モデルを作るための重回帰分析において、もっとも重要な作業は「残差分析」です。
残差分析に始まり、残差分析に終わると言っても過言ではありません。
一番最初の残差分析は、最初の説明変数を求めることです。
要するに、単相関の回帰式を作るところです。
これは、どんな場合でも、けっこう単純に出てきます。
ただし、いつも同じ項目とは行きません。
でも、こういうやり方はけっこう有効です。
というのは、統計データをたくさん並べて置くというやり方です。
たとえば、500m圏、1km圏、2km圏の国勢調査データ、商業統計データなどを沢山用意していて、その中で、目的変数との相関が一番大きい項目の統計データを説明変数にすることです。ただし、データの絶対値が0とか1のようにひじょうにちいさなデータ項目は、たまたま相関が大きくなっただけというのが多いので、気を付けてください。なるべく大きな数字になる統計項目を選ぶべきです。
さて、この方法とは別に、最初の説明変数を見つける方法があります。
それは、最大の売上 と 最小の売上を 比べて考えることです。なぜこの店の売上はひじょうに高く、なぜ、こっちの店は小さいのか?
この問いへの答えを数値化することです。
たとえば、最大の売上を示す店が駅に近い、けれども最小の売上を示す店は駅から遠いとしましょう。
そうしたら、駅に近いか遠いかという数値指標を考えれば良いですね。もちろん、これを表す数値で一番簡単なのは”駅から店舗までの距離”でしょう。
こうしてまず単相関だけで、回帰式を作ることです。
中学2年生くらいでやったことがあるでしょう。Y=aX+b ですね。
Yは目的変数。Xは説明変数(上の場合だと駅までの距離)、そして、a と b が単相関モデルの係数です。
これは、MSエクセルならば、次のような関数で算出することができます。
a=Slope(目的変数の列、説明変数の列)
b=Intercept(目的変数の列、説明変数の列)
です。
さあ、その次に、残差分析が始まります。
単相関モデルでは、各店、実績値-理論値 (これを残差といいます)が出ます。
そうしたら、もっとも大きい残差の店、もっとも小さい残差の店を比べるのです。
必ず共通した要因が見つかるとは限りませんので、どちらか一方だけでもいいのです。その要因を見つけましょう。
そして、出てきたアイデアこそ、売上予測の中核となる項目になるかもしれません。
2個目の説明変数(候補)が見つかったらさっそく重回帰分析ツールを使って計算してみましょう。
これで、2つとも t値が2以上だったら、説明変数として採用です。
とはいえ、今度は別の店舗で 大きな残差が発生しているかもしれませんし、相変わらず 上と同じ店で残差が大きいままになっているかもしれません。
売上予測できる重回帰分析とは、残差との戦いと言っても良いほど、長く苦しい戦いです。