048-711-7195
107-0062 東京都港区南青山2-2-15-942
月~金 9:00~18:00
売上予測モデルの肝は精度だということを忘れてはいけない。その1
売上予測モデルの肝は精度だということを忘れてはいけない。
精度が低い売上予測モデルは、言葉は悪いが、クソである。
特に気を付けてほしいのは、GIS屋さんに頼んでしまうことだ。
「売上予測モデル」は「統計学」の専門家が1年かかっても匙を投げてしまうほど、奥が深く難しいものの一つだ。
それを、「弊社のGISには、『売上予測』できる機能が入っていますから、便利ですよ」などという営業マンの言葉に騙されてはいけない。
売上予測モデルの古典的なものに「ハフモデル」というのがある。
これは、同業店の存在と家計調査年報、商勢圏の設定などが揃っていて初めて推計(予測などというものではない)のアルゴリズムが計算できる。たいていの場合、同業店との区別をどのようにするかによって、いろいろな数値が出てしまう。
アルゴリズムを簡単に言うと、推測は2段階に分かれる。
第一段階は、商勢圏(予測対象の物件の影響が及ぶ範囲)をどこまでにするかという決定とその範囲内にどれだけの需要があるかということを計算する必要がある。今時、こうした商勢圏などという曖昧な概念が当てはまる商売はない。「お客様はどちらから来られましたか?」という質問に、ファストフードの牛丼屋さんでも、10kmも20kmも離れた所からお客さんは来るものである。
アメリカ大陸のように、街がまるごと商勢圏としても問題がないくらい隣町との距離があるようなスカスカの土地ならばともかく日本のように山岳地帯を除くと、どこもへばりつくように人々が住んでいる国では、商勢圏などという考えは、あまりに観念的で、実用的ではない。
仮に、無理やり商勢圏を半径10kmの円の範囲を決めたたとしよう。
そこで、行うのは次に、需要の予測である。家計調査年報で拾える統計項目は、本屋さんなら、「書籍の購入」「雑誌・新聞紙の購読」であろう。レストランなら「外食費」という括りになるのだろう。いずれにせよ、お店で販売=お店で購入する という等式が成り立つのであれば良いがなかなか簡単ではない。
第二段階については、もっと大きな問題がある。それは、同業店同士の「魅力」を計算させることだ。この「魅力」については、従来、大型店同士の場合は、「売場面積」を使うことが多かった。しかし、それだけというのは、あまりにも簡単すぎるだろう。そこで、最近では、これに加えて、駐車場台数、階層、営業時間、商品の品質、従業員の充足度やら何やらいろいろな項目を入れる。
また、ハフモデルでは、店舗と、各人口中心地との距離Lを分母にもってくることが多い。「住んでいる所よりも遠いところは魅力が低い」という考えが入る。そうやって、人口中心Piにおける各同業店jに行く魅力Sijは、距離Liを使って、Sij=(Aj1*Aj2*・・・・・)/Li ということになる。これを周辺の人口中心全部で計算させる。そのあと、各同業店jについて合計ΣSiを出し、1地域iにおける予測対象のSiの比率を出し、これを同業店に人々が訪れる確率に仕上げる。
これにさきほどの1人当たりの家計調査で調査された物品の購入額を掛ける。最後に、これを全商勢圏について計算して合計値を出す。
このやり方に、理屈上は納得できる人はいるだろう。
しかし、いくらこのやり方が好きだと言っても、精度が低かったらまったく意味がない。
筆者の経験で恐縮だが、ハフモデルの精度は50%である。つまり、当たるも当たらないもフィフティフィフティだということである。
ハフモデルができたって、売上予測モデルができることにはならない。
ハフモデルが入っているGISを購入することほど愚の骨頂はない。何と言っても売上予測モデルの精度はメチャ低いのであるから。
説明をもっとやさしく読みたいならこちらがお勧め->パスコ
23/06/12
22/05/20
21/12/30
21/08/04
21/08/03
21/08/01
21/07/31
21/07/10
21/07/09
21/07/08
TOP
売上予測モデルの肝は精度だということを忘れてはいけない。
精度が低い売上予測モデルは、言葉は悪いが、クソである。
特に気を付けてほしいのは、GIS屋さんに頼んでしまうことだ。
「売上予測モデル」は「統計学」の専門家が1年かかっても匙を投げてしまうほど、奥が深く難しいものの一つだ。
それを、「弊社のGISには、『売上予測』できる機能が入っていますから、便利ですよ」などという営業マンの言葉に騙されてはいけない。
売上予測モデルの古典的なものに「ハフモデル」というのがある。
これは、同業店の存在と家計調査年報、商勢圏の設定などが揃っていて初めて推計(予測などというものではない)のアルゴリズムが計算できる。たいていの場合、同業店との区別をどのようにするかによって、いろいろな数値が出てしまう。
アルゴリズムを簡単に言うと、推測は2段階に分かれる。
第一段階は、商勢圏(予測対象の物件の影響が及ぶ範囲)をどこまでにするかという決定とその範囲内にどれだけの需要があるかということを計算する必要がある。今時、こうした商勢圏などという曖昧な概念が当てはまる商売はない。「お客様はどちらから来られましたか?」という質問に、ファストフードの牛丼屋さんでも、10kmも20kmも離れた所からお客さんは来るものである。
アメリカ大陸のように、街がまるごと商勢圏としても問題がないくらい隣町との距離があるようなスカスカの土地ならばともかく日本のように山岳地帯を除くと、どこもへばりつくように人々が住んでいる国では、商勢圏などという考えは、あまりに観念的で、実用的ではない。
仮に、無理やり商勢圏を半径10kmの円の範囲を決めたたとしよう。
そこで、行うのは次に、需要の予測である。家計調査年報で拾える統計項目は、本屋さんなら、「書籍の購入」「雑誌・新聞紙の購読」であろう。レストランなら「外食費」という括りになるのだろう。いずれにせよ、お店で販売=お店で購入する という等式が成り立つのであれば良いがなかなか簡単ではない。
第二段階については、もっと大きな問題がある。それは、同業店同士の「魅力」を計算させることだ。この「魅力」については、従来、大型店同士の場合は、「売場面積」を使うことが多かった。しかし、それだけというのは、あまりにも簡単すぎるだろう。そこで、最近では、これに加えて、駐車場台数、階層、営業時間、商品の品質、従業員の充足度やら何やらいろいろな項目を入れる。
また、ハフモデルでは、店舗と、各人口中心地との距離Lを分母にもってくることが多い。「住んでいる所よりも遠いところは魅力が低い」という考えが入る。そうやって、人口中心Piにおける各同業店jに行く魅力Sijは、距離Liを使って、Sij=(Aj1*Aj2*・・・・・)/Li ということになる。これを周辺の人口中心全部で計算させる。そのあと、各同業店jについて合計ΣSiを出し、1地域iにおける予測対象のSiの比率を出し、これを同業店に人々が訪れる確率に仕上げる。
これにさきほどの1人当たりの家計調査で調査された物品の購入額を掛ける。最後に、これを全商勢圏について計算して合計値を出す。
このやり方に、理屈上は納得できる人はいるだろう。
しかし、いくらこのやり方が好きだと言っても、精度が低かったらまったく意味がない。
筆者の経験で恐縮だが、ハフモデルの精度は50%である。つまり、当たるも当たらないもフィフティフィフティだということである。
ハフモデルができたって、売上予測モデルができることにはならない。
ハフモデルが入っているGISを購入することほど愚の骨頂はない。何と言っても売上予測モデルの精度はメチャ低いのであるから。
説明をもっとやさしく読みたいならこちらがお勧め->パスコ
●売上予測モデルの肝は精度だということを忘れてはいけない。その1
●売上予測モデルの肝は精度だということを忘れてはいけない。その2
●売上予測モデルの肝は精度だということを忘れてはいけない。その3
●売上予測の方法はいろいろあるけれど、精度となるとやっぱり○○○だ!
●マクドナルドで売上予測の手法で精度が急に上がってきた理由(ワケ)1
●マクドナルドで売上予測の手法で精度が急に上がってきた理由(ワケ)2
●売上予測の手法にはいろいろあるが、精度が高いのは重回帰モデル。