目的変数の決め方(売上予測を重回帰分析で行う手法4)

売上予測 30年の実績

048-711-7195

107-0062 東京都港区南青山2-2-15-942

月~金 9:00~18:00

lv_r

目的変数の決め方(売上予測を重回帰分析で行う手法4)

売上予測

2017/11/01 目的変数の決め方(売上予測を重回帰分析で行う手法4)

売上予測の手法 その5 重回帰分析を使った売上予測 4

 

重回帰分析を行うために揃えるデータで、もっとも重要なものは”目的変数”です。

 

そもそも、重回帰モデルというものは、どういう原理で計算されるかを示しておかなければいけません。

 

計算するためのすべてのデータが揃っていたとします。つまり、目的変数1セット(サンプル店舗数M個)、そして、説明変数の候補となる変数Nセット(同)があるとします。

すると、仮に、説明変数それぞれの重回帰係数が、それぞれa1、a2、・・・aN であって、固定値(Y切片)がa0であったとします。

そうした場合、M個の理論値を多項式で表すことができます。

つまり、理論値○=a1×□1+a2×□2+・・・・+a0 です。

考え方としてはそれぞれのサンプルで、実績値と理論値が良く似ている。数字が近い状態になれば良いのですが、それを目分量でやっていたらたいへんです。

そこで、(それぞれの実績値-それぞれの理論値)の二乗 を ぜーんぶ合計した値 が、一番小さくなるように、a1~ を計算して求める。

ということにするのです。

なぜ、二乗かというと、実績値と理論値の差はプラスばかりではなくマイナスもありますので、単にそれらを足してしまうと0になってしまい具合が悪いからです。二乗して合計すれば、ほとんどどんな場合でも、その値はプラスになりますね。

この計算は、最小二乗法と呼ばれています。この計算には、微分計算をしなければならないので、説明変数が2個以上あると、手計算ではとっても大変です。でも、コンピュータでやればあっという間に答えがでます。

(それぞれの実績値-それぞれの理論値)の二乗 を ぜーんぶ合計した値 が、一番小さくなるような、a1~ の値が出ます。

これは、とりも直さず、重回帰モデルの各変数に対する係数です。

 

理屈は、なんとなく分かってくれたと思いますが、ここでは、 目的変数1セット(サンプル店舗数M個)がないことには、重回帰分析は始まらないということは完全に理解してくれたかな?

 

では、この目的変数にすべき1セット(サンプル店舗数)は、何でしょう?

今までは、単に 「売上」だとしてきました(厳密に言えば「売上という実績値」ですが、ここでは「売上」と書きます。)

 

実は、売上といっても、立地分析では、暗黙の条件があるのです。

 

それは、「売上」が「立地」だけに依存する。立地以外の要因、例えば、個人の営業力 とか、地域における評判 とか、たまたま遭遇した催事 などに影響を受けていないことです。

ところが、どうでしょう? けっこう、店長の能力や従業員の能力などによって、売上が変化してしまいませんか?

仮に、こういうように「売上」に影響を与える立地以外の大きな要因が働いてしまう。しかも、それを数値化できないような場合は、その「売上」を目的変数にしてはならないのです。

「うちは、店長やスタッフのやり方次第で売上が倍も違うからなあ」とぼやいている経営幹部がいるチェーン企業では、「売上」を目的変数にはできません。ですので、高精度/売上予測モデルは作れません。

ただ、こういう方に限って、「精度の高い売上予測モデルがほしい」ともぼやくのです。困ったものです。

 

さて、目的変数になる「売上」でも、とある同業店が近くにできて、そのために売上が下がってしまったという場合は、その下がった後の売上を用いるべきです。

また、売上に限らず、来店客数 や、買取金額(リサイクルショップでは重要な指標ですね)、ないしは、特別な数値を目的変数にすることもできます。

 

ただし、経験上、「売上伸び率」であるとか、「販売促進の効果」であるとかは、目的変数にはなりにくいものです。

何でもかんでも、100年以上も統計解析の王様と言われてきた重回帰分析をもってしても、うまく答えができるとは限らない。

とはいえ、分析者の能力に応じて、相応の結果を出してくれるのもこの重回帰分析でして、これを否定してしまうと何の意味ある解析ができないということも厳然とした事実です。

 

売上予測に重回帰分析は欠かせない手法です。

 

20170402_00-thumbnail2

 

 

TOP