売上予測を作るアルゴリズムは２通りある

048-711-7195

107-0062 東京都港区南青山2-2-15-942

月～金 9:00～18:00

売上予測を作るアルゴリズムは２通りある

売上予測

売上予測を作るアルゴリズムには大きく２通りあると思ってよい。

売上予測をする１つめのアルゴリズムは、「単相関寄せ集め法」とでも名付けよう。

このやり方は、とりあえず、キャッチ率法や回転率法のような方法と似た方法だが、こういうのをたくさん組み合わせていくものだ。

例えば、売上と相関がある（相関係数0.3以上）の立地変数（商圏についての変数を含む）を見つける。

客席数、店舗面積、交通量、視界性評価、TG指数、商圏人口などなど

そして、それらを使って、Y＝aX+ｂ　のような1元１次式のモデルにする。

たとえば、（売上）＝a（客席数）＋ｂ　のようにして、aとｂを求めておく。

このaとbについては、エクセルの関数を用いて次のようにして簡単に求めることができる。

すなわち、

a＝SLOPE（売上のデータ列、客席数のデータ列）、ｂ＝INTERCEPT（売上のデータ列、客席数のデータ列）

もちろんこの売上のデータ列と客席数のデータ列はどの行も１対１で対応しておかなければならない。

同じように、客席数だけでなく、店舗面積、交通量、視界性評価、TG指数、商圏人口などなどにつても、1元１次式のモデルを作成しておくのだ。

それぞれ、売上との相関があるのであれば、必ずこのモデル化はできる。

こうしておくことで、新しい売上予測すべき物件の客席数のようなデータを入力することで、

それぞれの客席数、店舗面積、交通量、視界性評価、TG指数、商圏人口などに対応した売上予測の理論値を出すことができる。

もし、このモデルがN通りあるなら、N通りの理論値が出るわけだけれど、当然ながらそれぞれの理論値は互いにマチマチであって、同じものは１つとしてないであろう。

最後に、このN通りの理論値の「平均値」をとって、1つの結論としての売上予測にするというやり方である。

これが、「単相関寄せ集め法」のアルゴリズムである。

問題は、この場合の精度だが、残念ながら、精度の低いモデルをいくら作ってその平均値をとったところで（この「単相関寄せ集め法」）、精度は上がらないということだ。

そこで、次のアルゴリズムが必要となる。

２つ目の売上予測のアルゴリズムは、「重回帰分析」である。

すでに説明した通りだが、複数の説明変数を使って、N元1次式（線形式）を使ってモデル式を作り、このモデル式を使って物件の売上予測理論値を出すやり方である。

このN元とは、N個の説明変数ということだが、このN個とは、重回帰分析を行っていく最中に、もっとも適正な説明変数の組合せを分析者が選ぶことで得られる数である。

従って、最初に用意したすべての変数がそのまま選ばれるわけではない点に注意が必要だ。

たとえ、客席数、店舗面積、交通量、視界性評価、TG指数、商圏人口が用意されていたとしても、その中で店舗面積だけが選ばれるということもあり得る。

しかし、見つけられた（選ばれた）説明変数だけでじゅうぶん精度の高い売上予測の理論値が出せることが、

この第２のアルゴリズムの優れた点である。

予測精度　グラフ

◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆
林原安徳：有）ソルブは、立地と高精度/売上予測で「不振店」を根絶します。

東京都港区南青山2－2－15　ウィン青山942　有限会社ソルブ
電話　03-3538-6603　メール問合せは、こちら
◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆