東京都港区南青山2-2-15
重回帰分析による売上予測法 連載35
いよいよ、今回から最も本格的な方法、重回帰分析(じゅうかいきぶんせき)による売上予測の方法についてお話ししていきます。
この方法は、まず既存店の立地を調査して、立地と売上についての関係式(これを「モデル」と呼びます)を作ります。この関係式に、必要な立地データを入力して、売上を予測するというものです。
では、順を追って説明していきます。
まず、関係式のことについて、知ってもらわなければなりません。
この関係式とは、Y=a×X1+b×X2+・・・ のように、多項式で表わされます。一般的には、Yは目的変数、X1、X2・・は説明変数と言われますが、ここでは、Yには売上データ、X1、X2・・には立地に関わるデータ、例えば、商圏人口とか、視界性評価等が入ります(図1)。
図1
a、bは、それぞれの立地データに掛ける係数というものです。この係数を求める作業のことを「重回帰分析」と言い、出来上がった関係式を「売上予測モデル」と言います。
次に、知っておくべきことは、YやX1、X2・・・に使うデータは、既存店の立地の数だけあるということです。30店の既存店をこの分析のために使う(30店をサンプルにする)のであれば、Yも30個、X1やX2も30個用意することになります。
ちなみに、X1、X2・・・と「・・・」が入っているのは、説明変数がいくつもあるということです。最低でも10個、最終的に使わない変数もありますから、その数は100個になることも珍しくありません。
すると、30店をサンプルにするというだけで、30×100=3000個ものデータを集める必要があります。最初に、この分析をする人にとっては、途方もない量の数字を相手にしなければならず、たいへんだと思われるかもしれません。
しかし、あまり驚くまでのことはありません。
というのも、たとえどんなに大量のデータがあったとしても、計算して、答えの係数を出してくれるのはコンピュータであって、それは瞬時にやってくれます。
そして、いくら大量のデータでも、それらがあまり意味ないものであれば、そのほとんどがはじかれてしまいます(その意味は後述)。分析では、意味のあるデータを見つけ、使っていくことが重要なことです。
分析が、終了して、X1、X2・・・(各種立地のデータ)とY(売上)との関係がわかったとします。つまり、X1、X2・・・それぞれの係数が計算されたとします(コンピュータが計算します)。
すると、今度は、売上予測を求めたい物件の立地のデータを調査してくれば良いのです。商圏人口が必要なら、その商圏人口を。視界性評価が必要なら視界性評価のデータを求め、その関係式のX1、X2・・・に代入していきます。
すると。それぞれの係数がわかっているのですから、Yの値が立ちどころに計算できますね。
これが、予測売上になります。
さて、概略は以上ですが、ここからは、手順を追って説明します。
手順1 データ表を作成する
図2
まず、図2のような表を作ってください(マイクロソフト社のエクセルがお勧めです)。
縦軸に、No、そして、サンプルにする店の店名を記入します。30店あれば30行分用意します。
横軸の方向には、目的変数の売上、そして、説明変数として、いくつもの立地に関する名称を列挙していきます。この表には、商圏人口、視界性評価、○○と記入してあります。
手順2 目的変数(売上)を決める
これは、平均月商であっても、年商または平均日商であっても構いません。また、できるだけ最近のデータを使ってください。一度グラフ化しておいて、この数か月以内に大きな売上の上昇、または下降がある場合は、必ずしも年間を通した平均である必要はありません。何らかの立地要因(競合店が出店した等)が働いたと考えて、最近のその数か月間の平均を用いるようにします(図3)。
図3
また、目的変数は、売上に限るわけではありません。来店客数でも良いですし、入館者数、入場者数でも構いません。さらに、時間帯別の売上や来店手段別の売上、客席のある階層別売上、商品カテゴリー別売上など細分化されたものでも目的変数にすることができます。
手順3 説明変数の骨を作る
最初の説明変数(第一変数)を見つけることを、説明変数の骨(以下、単に「骨」と呼びます)を作ると言います。骨は、業種業態によって多少の違いはあるものの、たいていは商圏規模を表すような項目を見つけるようにします。例えば、商圏を設定して、その中に住む人口、あるいは世帯数を用います。また、年間小売販売額などその街の商業集積力が説明変数になる場合もあります。この骨は、売上と最低でも0.4以上の相関(12月号参照)があることが望ましいでしょう。
手順4 理論値を出し、残差を求める。
図4
骨が見つかると、この骨を元にして、理論値を計算することができます(図4)。理論値は、簡単な1次式、Y=a×X+b になります。この場合、Xは骨のデータです。
aやbは、データがあれば計算して出すことができますが、エクセル表でしたら、それぞれSLOPE関数、INTERCEPT関数を用いて算出することができます。
目的変数から理論値を引いた値を「残差」と呼びます。この残差を計算しておきましょう。
手順5 第二説明変数を見つける
骨が見つかったら、第二説明変数の探索です。(この二つ目からは、重回帰分析専用のソフトウェアが必要になります。MSエクセルをお持ちの方は、「分析ツール」をアドインに加えるとこの分析ができるようになります。詳しくは、マニュアルをご参照ください)。
図5
この変数は、最も残差の大きいサンプル(店舗)に着目して見つけます(図5の例では、E店になります)。残差が大きいということは、それだけ、骨だけでは説明できない大きな原因があることになります。そして、その原因として考えられそうな立地要因を見つけたら、最初の表にデータを入力していきます。
手順6 重回帰ソフトの設定と実行
図6
「分析ツール」の中には、「回帰分析」というソフトウェアが入っていますのでこれを起動させます。すると、Yの範囲、Xの範囲を指定する画面が出ますので、これらを指定して(図6)から、実行をします。すると、係数が計算されて出てきます。図7の「概要」にあるとおり、この表を用いて実行すると、商圏人口には25.68、視界性評価には122.02という係数が求まったことがわかります。
図7
手順7 理論値を出し、残差を求め、以降これを繰り返す。
係数が求まったので、理論値を計算することができます。すると、先ほどと同じように残差も求まります。この時、求まった残差が、先ほどの残差より小さくなっていれば、この要因を第二説明変数として良いことになります。もし、良いならば、次の第三変数の探索に入ります。
この辺りが、とても肝心なところですので、次回にもっと詳しく説明しましょう。
(プロフィール)
林原安徳はやしはら やすのり 売上予測のプロ。経営コンサルタント。東大(農)卒後、日本マクドナルド(株)出店調査部にて、「立地と売上予測」を基礎研究。退社独立後、理論を独自に深耕させSORBICS(ソルビクス)と命名。これに基づき、チェーン展開する多くの企業や個人を指導。主な著作「実践・売上予測と立地判定」(商業界)「最新版 これが繁盛立地だ!」(同文舘出版)。無料メルマガを配信中
東京都港区南青山2-2-15 ウィン青山942 有限会社ソルブ 電話 03-3538-6603 メール問合せは、こちら ◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆
24/09/08
23/06/12
22/05/20
TOP
いよいよ、今回から最も本格的な方法、重回帰分析(じゅうかいきぶんせき)による売上予測の方法についてお話ししていきます。
この方法は、まず既存店の立地を調査して、立地と売上についての関係式(これを「モデル」と呼びます)を作ります。この関係式に、必要な立地データを入力して、売上を予測するというものです。
では、順を追って説明していきます。
まず、関係式のことについて、知ってもらわなければなりません。
この関係式とは、Y=a×X1+b×X2+・・・ のように、多項式で表わされます。一般的には、Yは目的変数、X1、X2・・は説明変数と言われますが、ここでは、Yには売上データ、X1、X2・・には立地に関わるデータ、例えば、商圏人口とか、視界性評価等が入ります(図1)。
図1
a、bは、それぞれの立地データに掛ける係数というものです。この係数を求める作業のことを「重回帰分析」と言い、出来上がった関係式を「売上予測モデル」と言います。
次に、知っておくべきことは、YやX1、X2・・・に使うデータは、既存店の立地の数だけあるということです。30店の既存店をこの分析のために使う(30店をサンプルにする)のであれば、Yも30個、X1やX2も30個用意することになります。
ちなみに、X1、X2・・・と「・・・」が入っているのは、説明変数がいくつもあるということです。最低でも10個、最終的に使わない変数もありますから、その数は100個になることも珍しくありません。
すると、30店をサンプルにするというだけで、30×100=3000個ものデータを集める必要があります。最初に、この分析をする人にとっては、途方もない量の数字を相手にしなければならず、たいへんだと思われるかもしれません。
しかし、あまり驚くまでのことはありません。
というのも、たとえどんなに大量のデータがあったとしても、計算して、答えの係数を出してくれるのはコンピュータであって、それは瞬時にやってくれます。
そして、いくら大量のデータでも、それらがあまり意味ないものであれば、そのほとんどがはじかれてしまいます(その意味は後述)。分析では、意味のあるデータを見つけ、使っていくことが重要なことです。
分析が、終了して、X1、X2・・・(各種立地のデータ)とY(売上)との関係がわかったとします。つまり、X1、X2・・・それぞれの係数が計算されたとします(コンピュータが計算します)。
すると、今度は、売上予測を求めたい物件の立地のデータを調査してくれば良いのです。商圏人口が必要なら、その商圏人口を。視界性評価が必要なら視界性評価のデータを求め、その関係式のX1、X2・・・に代入していきます。
すると。それぞれの係数がわかっているのですから、Yの値が立ちどころに計算できますね。
これが、予測売上になります。
さて、概略は以上ですが、ここからは、手順を追って説明します。
手順1 データ表を作成する
図2
まず、図2のような表を作ってください(マイクロソフト社のエクセルがお勧めです)。
縦軸に、No、そして、サンプルにする店の店名を記入します。30店あれば30行分用意します。
横軸の方向には、目的変数の売上、そして、説明変数として、いくつもの立地に関する名称を列挙していきます。この表には、商圏人口、視界性評価、○○と記入してあります。
手順2 目的変数(売上)を決める
これは、平均月商であっても、年商または平均日商であっても構いません。また、できるだけ最近のデータを使ってください。一度グラフ化しておいて、この数か月以内に大きな売上の上昇、または下降がある場合は、必ずしも年間を通した平均である必要はありません。何らかの立地要因(競合店が出店した等)が働いたと考えて、最近のその数か月間の平均を用いるようにします(図3)。
図3
また、目的変数は、売上に限るわけではありません。来店客数でも良いですし、入館者数、入場者数でも構いません。さらに、時間帯別の売上や来店手段別の売上、客席のある階層別売上、商品カテゴリー別売上など細分化されたものでも目的変数にすることができます。
手順3 説明変数の骨を作る
最初の説明変数(第一変数)を見つけることを、説明変数の骨(以下、単に「骨」と呼びます)を作ると言います。骨は、業種業態によって多少の違いはあるものの、たいていは商圏規模を表すような項目を見つけるようにします。例えば、商圏を設定して、その中に住む人口、あるいは世帯数を用います。また、年間小売販売額などその街の商業集積力が説明変数になる場合もあります。この骨は、売上と最低でも0.4以上の相関(12月号参照)があることが望ましいでしょう。
手順4 理論値を出し、残差を求める。
図4
骨が見つかると、この骨を元にして、理論値を計算することができます(図4)。理論値は、簡単な1次式、Y=a×X+b になります。この場合、Xは骨のデータです。
aやbは、データがあれば計算して出すことができますが、エクセル表でしたら、それぞれSLOPE関数、INTERCEPT関数を用いて算出することができます。
目的変数から理論値を引いた値を「残差」と呼びます。この残差を計算しておきましょう。
手順5 第二説明変数を見つける
骨が見つかったら、第二説明変数の探索です。(この二つ目からは、重回帰分析専用のソフトウェアが必要になります。MSエクセルをお持ちの方は、「分析ツール」をアドインに加えるとこの分析ができるようになります。詳しくは、マニュアルをご参照ください)。
図5
この変数は、最も残差の大きいサンプル(店舗)に着目して見つけます(図5の例では、E店になります)。残差が大きいということは、それだけ、骨だけでは説明できない大きな原因があることになります。そして、その原因として考えられそうな立地要因を見つけたら、最初の表にデータを入力していきます。
手順6 重回帰ソフトの設定と実行
図6
「分析ツール」の中には、「回帰分析」というソフトウェアが入っていますのでこれを起動させます。すると、Yの範囲、Xの範囲を指定する画面が出ますので、これらを指定して(図6)から、実行をします。すると、係数が計算されて出てきます。図7の「概要」にあるとおり、この表を用いて実行すると、商圏人口には25.68、視界性評価には122.02という係数が求まったことがわかります。
図7
手順7 理論値を出し、残差を求め、以降これを繰り返す。
係数が求まったので、理論値を計算することができます。すると、先ほどと同じように残差も求まります。この時、求まった残差が、先ほどの残差より小さくなっていれば、この要因を第二説明変数として良いことになります。もし、良いならば、次の第三変数の探索に入ります。
この辺りが、とても肝心なところですので、次回にもっと詳しく説明しましょう。
(プロフィール)
林原安徳はやしはら やすのり
売上予測のプロ。経営コンサルタント。東大(農)卒後、日本マクドナルド(株)出店調査部にて、「立地と売上予測」を基礎研究。退社独立後、理論を独自に深耕させSORBICS(ソルビクス)と命名。これに基づき、チェーン展開する多くの企業や個人を指導。主な著作「実践・売上予測と立地判定」(商業界)「最新版 これが繁盛立地だ!」(同文舘出版)。無料メルマガを配信中
統計てきめん2プレミアのダウロードサイト
統計てきめん2プレミアの紹介動画5分
林原安徳:有)ソルブは、立地と高精度/売上予測で「不振店」を根絶します。
東京都港区南青山2-2-15 ウィン青山942 有限会社ソルブ
電話 03-3538-6603 メール問合せは、こちら
◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆