048-711-7195
107-0062 東京都港区南青山2-2-15-942
月~金 9:00~18:00
売上予測を作るアルゴリズムは2通りある
売上予測を作るアルゴリズムには大きく2通りあると思ってよい。
売上予測をする1つめのアルゴリズムは、「単相関寄せ集め法」とでも名付けよう。
このやり方は、とりあえず、キャッチ率法や回転率法のような方法と似た方法だが、こういうのをたくさん組み合わせていくものだ。
例えば、売上と相関がある(相関係数0.3以上)の立地変数(商圏についての変数を含む)を見つける。
客席数、店舗面積、交通量、視界性評価、TG指数、商圏人口などなど
そして、それらを使って、Y=aX+b のような1元1次式のモデルにする。
たとえば、(売上)=a(客席数)+b のようにして、aとbを求めておく。
このaとbについては、エクセルの関数を用いて次のようにして簡単に求めることができる。
すなわち、
a=SLOPE(売上のデータ列、客席数のデータ列)、b=INTERCEPT(売上のデータ列、客席数のデータ列)
もちろんこの売上のデータ列と客席数のデータ列はどの行も1対1で対応しておかなければならない。
同じように、客席数だけでなく、店舗面積、交通量、視界性評価、TG指数、商圏人口などなどにつても、1元1次式のモデルを作成しておくのだ。
それぞれ、売上との相関があるのであれば、必ずこのモデル化はできる。
こうしておくことで、新しい売上予測すべき物件の客席数のようなデータを入力することで、
それぞれの客席数、店舗面積、交通量、視界性評価、TG指数、商圏人口などに対応した売上予測の理論値を出すことができる。
もし、このモデルがN通りあるなら、N通りの理論値が出るわけだけれど、当然ながらそれぞれの理論値は互いにマチマチであって、同じものは1つとしてないであろう。
最後に、このN通りの理論値の「平均値」をとって、1つの結論としての売上予測にするというやり方である。
これが、「単相関寄せ集め法」のアルゴリズムである。
問題は、この場合の精度だが、残念ながら、精度の低いモデルをいくら作ってその平均値をとったところで(この「単相関寄せ集め法」)、精度は上がらないということだ。
そこで、次のアルゴリズムが必要となる。
2つ目の売上予測のアルゴリズムは、「重回帰分析」である。
すでに説明した通りだが、複数の説明変数を使って、N元1次式(線形式)を使ってモデル式を作り、このモデル式を使って物件の売上予測理論値を出すやり方である。
このN元とは、N個の説明変数ということだが、このN個とは、重回帰分析を行っていく最中に、もっとも適正な説明変数の組合せを分析者が選ぶことで得られる数である。
従って、最初に用意したすべての変数がそのまま選ばれるわけではない点に注意が必要だ。
たとえ、客席数、店舗面積、交通量、視界性評価、TG指数、商圏人口が用意されていたとしても、その中で店舗面積だけが選ばれるということもあり得る。
しかし、見つけられた(選ばれた)説明変数だけでじゅうぶん精度の高い売上予測の理論値が出せることが、
この第2のアルゴリズムの優れた点である。
東京都港区南青山2-2-15 ウィン青山942 有限会社ソルブ 電話 03-3538-6603 メール問合せは、こちら ◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆
23/06/12
22/05/20
21/12/30
21/08/04
21/08/03
21/08/01
21/07/31
21/07/10
21/07/09
21/07/08
TOP
売上予測を作るアルゴリズムには大きく2通りあると思ってよい。
売上予測をする1つめのアルゴリズムは、「単相関寄せ集め法」とでも名付けよう。
このやり方は、とりあえず、キャッチ率法や回転率法のような方法と似た方法だが、こういうのをたくさん組み合わせていくものだ。
例えば、売上と相関がある(相関係数0.3以上)の立地変数(商圏についての変数を含む)を見つける。
客席数、店舗面積、交通量、視界性評価、TG指数、商圏人口などなど
そして、それらを使って、Y=aX+b のような1元1次式のモデルにする。
たとえば、(売上)=a(客席数)+b のようにして、aとbを求めておく。
このaとbについては、エクセルの関数を用いて次のようにして簡単に求めることができる。
すなわち、
a=SLOPE(売上のデータ列、客席数のデータ列)、b=INTERCEPT(売上のデータ列、客席数のデータ列)
もちろんこの売上のデータ列と客席数のデータ列はどの行も1対1で対応しておかなければならない。
同じように、客席数だけでなく、店舗面積、交通量、視界性評価、TG指数、商圏人口などなどにつても、1元1次式のモデルを作成しておくのだ。
それぞれ、売上との相関があるのであれば、必ずこのモデル化はできる。
こうしておくことで、新しい売上予測すべき物件の客席数のようなデータを入力することで、
それぞれの客席数、店舗面積、交通量、視界性評価、TG指数、商圏人口などに対応した売上予測の理論値を出すことができる。
もし、このモデルがN通りあるなら、N通りの理論値が出るわけだけれど、当然ながらそれぞれの理論値は互いにマチマチであって、同じものは1つとしてないであろう。
最後に、このN通りの理論値の「平均値」をとって、1つの結論としての売上予測にするというやり方である。
これが、「単相関寄せ集め法」のアルゴリズムである。
問題は、この場合の精度だが、残念ながら、精度の低いモデルをいくら作ってその平均値をとったところで(この「単相関寄せ集め法」)、精度は上がらないということだ。
そこで、次のアルゴリズムが必要となる。
2つ目の売上予測のアルゴリズムは、「重回帰分析」である。
すでに説明した通りだが、複数の説明変数を使って、N元1次式(線形式)を使ってモデル式を作り、このモデル式を使って物件の売上予測理論値を出すやり方である。
このN元とは、N個の説明変数ということだが、このN個とは、重回帰分析を行っていく最中に、もっとも適正な説明変数の組合せを分析者が選ぶことで得られる数である。
従って、最初に用意したすべての変数がそのまま選ばれるわけではない点に注意が必要だ。
たとえ、客席数、店舗面積、交通量、視界性評価、TG指数、商圏人口が用意されていたとしても、その中で店舗面積だけが選ばれるということもあり得る。
しかし、見つけられた(選ばれた)説明変数だけでじゅうぶん精度の高い売上予測の理論値が出せることが、
この第2のアルゴリズムの優れた点である。
統計てきめん2プレミアのダウロードサイト
統計てきめん2プレミアの紹介動画5分
林原安徳:有)ソルブは、立地と高精度/売上予測で「不振店」を根絶します。
東京都港区南青山2-2-15 ウィン青山942 有限会社ソルブ
電話 03-3538-6603 メール問合せは、こちら
◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆