048-711-7195
107-0062 東京都港区南青山2-2-15-942
月~金 9:00~18:00
「自動で簡単に売上予測ができる」という幻想
今から約30年ほど前。
当時は、「Lotus123」という表計算ソフトが全盛でした。
●最初から行き詰まるときは、考えるチャンス。重回帰分析の挑戦 ●変数が多くなり、エクセルの重回帰分析が嫌いにならない内に行動すべし ●売上予測のための重回帰分析という計算 飲食店経営2013年FEB (前半) ●売上予測のための重回帰分析という計算 飲食店経営2013年FEB (後半) ●重回帰分析による売上予測モデルの落とし穴 飲食店経営2013MAR (前半) ●重回帰分析による売上予測モデルの落とし穴 飲食店経営2013MAR (後半)
「説明変数を適切に選んで、目的変数との関係式を作れる。そして、その関係式とデータさえあれば理論値を算出できる。」
「この方法を使えば、何だって理論値が出せる。簡単に予測ができる。」
今となってみれば、そんなはずはないのですが、 当時は今のように様々な分析ソフトもありませんでしたから、そんな時代に出てきた「画期的」に見えるソフトに、盲目的になってしまっていたのですね。
それほどまでに、「重回帰分析が簡単におこなえる」ということは、 革命ともいえるほどの衝撃だった。
重回帰分析は、ご存知のように、売上予測をはじめ、様々なことの使われる手法です。
例えば、世俗的なことで言えば、競馬や競輪、株価の予想だってできてします。
仕事上のことなら、 「どんな販促とどんな要因を合わせるとどんな結果が出るか」であったり、あるいは、「どういう能力、仕事、性格があると給与が高くなる」ということについても、原理的には予測可能なわけです。
もちろん、こうしたことをするためには、 豊富なデータや慎重かつ柔軟な分析力が不可欠です。
しかし、そんな深いことまで考えが及ばなかった当時は、「どんなことであっても、データさえ集まれば、重回帰モデル=予測モデルを作ることができ、 必ず役立つ」
と狂喜したわけです。
そして、売上予測ばかりではなく、例えば、「外食店のQSC(品質・サービス・清潔さ)の改善は売上向上に直結する」という仮説を立てて、その証明のために、データ集めに奔走したこともあった。
どうやら、この「狂喜」に近い感覚は、重回帰分析を経験したことがある人なら、誰もが一度は抱くようです。
つまり、「データさえあれば重回帰モデルを作って何でも予測できる」という幻想ですね。 そう思い込んでしまう。 それくらい、重回帰分析とはきわめて効果的な手法です。
しかも、 重回帰分析のソフトウェアの中でも高価なものには、その「思い込み」を増幅させてしまうような、一見便利そうな機能が沢山付いています。
それは例えば、「自動選択投入法」「変数の自動選択」と呼ばれる機能。
これは、沢山のデータを説明変数として用意すれば、コンピュータが、最適な説明変数の組み合わせを、統計的に、 かつ自動的に探してくれるというものです。
しかし、これが大きな落とし穴です。
コンピュータが選んだ、「統計的に最適な説明変数の組み合わせ」は、実際のところ、大抵の場合は役に立ちません。
なぜなら、コンピュータは人間ではないので、「人間の常識や感覚がわからない」からです。
例えば・・・・「人間の身長と体重」は、きわめて強い「正の相関関係」にあります。
身長の高い人ほど体重は重く、身長の低い人ほど体重は軽い傾向にある。 これは、 「統計的」にも「感覚的」にも、間違いなく言えることです。
ですから「身長170cmなのに体重45kgしかありません」と聞けば、多くの人が驚いて「随分と痩せているのですね」というわけです。
しかし、ここで、「人間の身長を決定づけるのは体重である」あるいは 「人間の体重を決定づけるのは身長である」と言われたら、どうでしょうか?
「体重が増えることによって身長が伸びる」なんていう因果関係が成立しないことは、 「統計的」に考えなくたって分かるはずです。
つまり、人間の身長と体重には、「相関関係」があるだけで、直接的な「因果関係」はない。
「相関関係」と「因果関係」は似ているようで、異なるものです。
そして統計解析でわかることは「相関関係」であって、 「因果関係」ではありません。
こうしたことをわきまえないと、
「人間の身長は体重で決まる。統計的にそうなっている」というような、トンチンカンな話になってしまいます。
しかしながら、ソフトウェアによる「自動選択投入法」とは、まるで、「人間の身長は体重で決まる」という因果関係を導き出してしまうようなものなのです。
「自動選択投入法」「変数の自動選択」というのは、因果関係の吟味なんかすっ飛ばしてしまえ、という手法であり、 きわめて恐ろしい間違いを引き起こすものなのです。
まずは「自動選択投入法」で分析し、選ばれた説明変数について後から因果関係を吟味すればいいのでは?
残念ながら、それでも大抵は失敗します。「落とし穴」は、わかりにくいからこそ「落とし穴」なのです。
例えば、分析において、よくこうしたケースがあります。
・競合店が多いほど売上が高くなる ・営業時間が長い店ほど売上が低い
これらは、常識的に考えたら、どちらも感覚に馴染みませんね。
競合店があったら、売上げは「低くなる」はずですし、逆に、 営業時間を延ばせば、売上げは「高くなる」はずです。
けれども、「自動選択投入法」で変数を選ぶと、上記のような、感覚と真逆の分析をされてしまうのです。
これは、なぜか
競合店が多いエリアというのは、往々にして、「商業集積の規模が大きいエリア」です。
巨大な流入があるエリアだから、様々な企業が出店し、競合店の数が増えていくのです。
そして、「商業集積の規模」は、ほとんどの場合、売上げに最も大きく関係する立地要因です。
すなわち、「商業集積の規模が大きいから売上げは高い」
ということが正しい考え方のはずなのに、「商業集積の規模が大きいと競合店の数が多い」
という余計なものが入ってくることによって、「競合店の数が多いと売上げは高い」
という間違った論理に、最終的に結びついてしまう。
営業時間も、同様。
これは、多くの場合、「そもそも売れない店だから営業時間を長くして頑張っている」
という状況なのです。
それなのに、「自動選択投入法」では、見た目に表れてくる数字の変動しかピックアップしないので、「売れない店は営業時間を長くしている」
という状態が逆転して、「営業時間を長くしている店は大体売れていない」
という発想に繋がり、「営業時間が長いほど売上げは低い」
という、間違った結論を導き出す。
こうして書けば、この程度の論理は、言われるまでもなく気付くだろうと思われるかもしれません。けれども、本当に驚くくらい、よくよく見たら論理が破綻しているのに、それに一見気付けないケースは、よくあるのです。
だからこそ、重回帰分析をする人間は、「一体、何が真実なのか? 」「何をどう説明することが最も理にかなっているのか」ということをしっかり考えなければなりません。
浮き彫りになった問題に対するこうした考察が、売上予測をより本質的なものにするのであり、精度を高めることにつながっていくのです。
しかし「自動選択投入法」は、こうした考察過程をすっ飛ばします。
コンピュータは説明変数の候補に対して 数学的にプラス・マイナスの符号を付けます。 人間は、往々にして、後からこの符号の意味を説明する理屈を、 ひねり出すことになります。
これで、「精度の高い売上予測」なんて、できるはずもありません。
30年前にはこのことに気付かず、盲目的に「簡単に売上予測ができる」という幻想に、あわや騙されてしまうところでした。
「統計上」は精度が高いように見えても、論理的に、矛盾や問題点を抱えている売上予測モデルは、実際には決して使い物になりません。
そのことを、経験上身に染みて分かっていました。
そうして、30余年・・・・様々なソフトウェアが生まれ、便利になってきた今になっても、その手法のまま、売上予測を続けています。
結局、 ソフトウェアがどんなに便利になろうと、「お店の立地」の分析とは、「人の心」の分析です。
結局のところ、人が自分の頭で考え、手と目を使って分析すること以上に、精度が高くなる手段なんて、無いのです。
昨今、 今度は「AI」が台頭してきました。
頭ごなしに、そういう技術的な革新を否定することはいたしません。
けれども、「AIなら高精度売上予測ができるはずだ」というように、盲目的に捉えてしまうことには、 警鐘を鳴らしたい。
人が使いこなせばこそ、道具は真価を発揮しますが、機械は、どんなに賢くなっても、 (SFのように心を持つ機械が生まれるのはまだずっと先ですから) 人の心を捉えることはできません。
そのことを、 忘れないようにいてください。AIに頼り過ぎれば、出店システムの崩壊を招きかねません。そうならないためには、それを使う人・・・・ すなわち店舗開発部員や出店調査部員のスキルを、高めていくことが必要不可欠です。
「重回帰分析の方法」の関連リンク ●売上予測を重回帰分析で行う手法 1 ●t値が大事です。(売上予測を重回帰分析で行う手法2) ●修正済み相関係数とは(売上予測を重回帰分析で行う手法3) ●目的変数の決め方(売上予測を重回帰分析で行う手法4) ●残差分析で考える(売上予測を重回帰分析で行う手法5) ●マルチコに気をつけよ(売上予測を重回帰分析で行う手法6) ●感性を数値化せよ(売上予測を重回帰分析で行う手法7) ●立地指数の出し方(売上予測を重回帰分析で行う手法9) ●商圏分断を数値化する(売上予測を重回帰分析で行う手法10) ●商圏拡大を数値化する(売上予測を重回帰分析で行う手法11) ●ダミー変数が役に立つ(売上予測を重回帰分析で行う手法13) ●売上予測のフォーマット(売上予測を重回帰分析で行う手法14) ●売上予測値と実際の理論値の差を計算する(売上予測を重回帰分析で行う手法15) ●エクセルを活用しよう 1(売上予測を重回帰分析で行う手法16) ●エクセルを活用しよう 2(売上予測を重回帰分析で行う手法17) ●売上予測モデルはいくつ作れば良いか?(売上予測を重回帰分析で行う手法18)く ●売上予測フォーマット(売上予測を重回帰分析で行う手法19) ●売上予測をエクセルで実現する (売上予測を重回帰分析で行う手法20) ●重回帰分析の出来は、データの多さでなく、残差分析の深さで決まる。 ●高精度/売上予測モデルはエクセルで分析したら、エクセルで運用した方が良い2つの理由。
23/06/12
22/05/20
21/12/30
21/08/04
21/08/03
21/08/01
21/07/31
21/07/10
21/07/09
21/07/08
TOP
今から約30年ほど前。
当時は、「Lotus123」という表計算ソフトが全盛でした。
●最初から行き詰まるときは、考えるチャンス。重回帰分析の挑戦
●変数が多くなり、エクセルの重回帰分析が嫌いにならない内に行動すべし
●売上予測のための重回帰分析という計算 飲食店経営2013年FEB (前半)
●売上予測のための重回帰分析という計算 飲食店経営2013年FEB (後半)
●重回帰分析による売上予測モデルの落とし穴 飲食店経営2013MAR (前半)
●重回帰分析による売上予測モデルの落とし穴 飲食店経営2013MAR (後半)
「説明変数を適切に選んで、目的変数との関係式を作れる。そして、その関係式とデータさえあれば理論値を算出できる。」
「この方法を使えば、何だって理論値が出せる。簡単に予測ができる。」
今となってみれば、そんなはずはないのですが、 当時は今のように様々な分析ソフトもありませんでしたから、そんな時代に出てきた「画期的」に見えるソフトに、盲目的になってしまっていたのですね。
それほどまでに、「重回帰分析が簡単におこなえる」ということは、 革命ともいえるほどの衝撃だった。
重回帰分析は、ご存知のように、売上予測をはじめ、様々なことの使われる手法です。
例えば、世俗的なことで言えば、競馬や競輪、株価の予想だってできてします。
仕事上のことなら、 「どんな販促とどんな要因を合わせるとどんな結果が出るか」であったり、あるいは、「どういう能力、仕事、性格があると給与が高くなる」ということについても、原理的には予測可能なわけです。
もちろん、こうしたことをするためには、 豊富なデータや慎重かつ柔軟な分析力が不可欠です。
しかし、そんな深いことまで考えが及ばなかった当時は、「どんなことであっても、データさえ集まれば、重回帰モデル=予測モデルを作ることができ、 必ず役立つ」
と狂喜したわけです。
そして、売上予測ばかりではなく、例えば、「外食店のQSC(品質・サービス・清潔さ)の改善は売上向上に直結する」という仮説を立てて、その証明のために、データ集めに奔走したこともあった。
どうやら、この「狂喜」に近い感覚は、重回帰分析を経験したことがある人なら、誰もが一度は抱くようです。
つまり、「データさえあれば重回帰モデルを作って何でも予測できる」という幻想ですね。
そう思い込んでしまう。
それくらい、重回帰分析とはきわめて効果的な手法です。
しかも、 重回帰分析のソフトウェアの中でも高価なものには、その「思い込み」を増幅させてしまうような、一見便利そうな機能が沢山付いています。
それは例えば、「自動選択投入法」「変数の自動選択」と呼ばれる機能。
これは、沢山のデータを説明変数として用意すれば、コンピュータが、最適な説明変数の組み合わせを、統計的に、 かつ自動的に探してくれるというものです。
しかし、これが大きな落とし穴です。
コンピュータが選んだ、「統計的に最適な説明変数の組み合わせ」は、実際のところ、大抵の場合は役に立ちません。
なぜなら、コンピュータは人間ではないので、「人間の常識や感覚がわからない」からです。
例えば・・・・「人間の身長と体重」は、きわめて強い「正の相関関係」にあります。
身長の高い人ほど体重は重く、身長の低い人ほど体重は軽い傾向にある。
これは、 「統計的」にも「感覚的」にも、間違いなく言えることです。
ですから「身長170cmなのに体重45kgしかありません」と聞けば、多くの人が驚いて「随分と痩せているのですね」というわけです。
しかし、ここで、「人間の身長を決定づけるのは体重である」あるいは
「人間の体重を決定づけるのは身長である」と言われたら、どうでしょうか?
「体重が増えることによって身長が伸びる」なんていう因果関係が成立しないことは、
「統計的」に考えなくたって分かるはずです。
つまり、人間の身長と体重には、「相関関係」があるだけで、直接的な「因果関係」はない。
「相関関係」と「因果関係」は似ているようで、異なるものです。
そして統計解析でわかることは「相関関係」であって、 「因果関係」ではありません。
こうしたことをわきまえないと、
「人間の身長は体重で決まる。統計的にそうなっている」というような、トンチンカンな話になってしまいます。
しかしながら、ソフトウェアによる「自動選択投入法」とは、まるで、「人間の身長は体重で決まる」という因果関係を導き出してしまうようなものなのです。
「自動選択投入法」「変数の自動選択」というのは、因果関係の吟味なんかすっ飛ばしてしまえ、という手法であり、 きわめて恐ろしい間違いを引き起こすものなのです。
まずは「自動選択投入法」で分析し、選ばれた説明変数について後から因果関係を吟味すればいいのでは?
残念ながら、それでも大抵は失敗します。「落とし穴」は、わかりにくいからこそ「落とし穴」なのです。
例えば、分析において、よくこうしたケースがあります。
・競合店が多いほど売上が高くなる
・営業時間が長い店ほど売上が低い
これらは、常識的に考えたら、どちらも感覚に馴染みませんね。
競合店があったら、売上げは「低くなる」はずですし、逆に、 営業時間を延ばせば、売上げは「高くなる」はずです。
けれども、「自動選択投入法」で変数を選ぶと、上記のような、感覚と真逆の分析をされてしまうのです。
これは、なぜか
競合店が多いエリアというのは、往々にして、「商業集積の規模が大きいエリア」です。
巨大な流入があるエリアだから、様々な企業が出店し、競合店の数が増えていくのです。
そして、「商業集積の規模」は、ほとんどの場合、売上げに最も大きく関係する立地要因です。
すなわち、「商業集積の規模が大きいから売上げは高い」
ということが正しい考え方のはずなのに、「商業集積の規模が大きいと競合店の数が多い」
という余計なものが入ってくることによって、「競合店の数が多いと売上げは高い」
という間違った論理に、最終的に結びついてしまう。
営業時間も、同様。
これは、多くの場合、「そもそも売れない店だから営業時間を長くして頑張っている」
という状況なのです。
それなのに、「自動選択投入法」では、見た目に表れてくる数字の変動しかピックアップしないので、「売れない店は営業時間を長くしている」
という状態が逆転して、「営業時間を長くしている店は大体売れていない」
という発想に繋がり、「営業時間が長いほど売上げは低い」
という、間違った結論を導き出す。
こうして書けば、この程度の論理は、言われるまでもなく気付くだろうと思われるかもしれません。けれども、本当に驚くくらい、よくよく見たら論理が破綻しているのに、それに一見気付けないケースは、よくあるのです。
だからこそ、重回帰分析をする人間は、「一体、何が真実なのか? 」「何をどう説明することが最も理にかなっているのか」ということをしっかり考えなければなりません。
浮き彫りになった問題に対するこうした考察が、売上予測をより本質的なものにするのであり、精度を高めることにつながっていくのです。
しかし「自動選択投入法」は、こうした考察過程をすっ飛ばします。
コンピュータは説明変数の候補に対して
数学的にプラス・マイナスの符号を付けます。
人間は、往々にして、後からこの符号の意味を説明する理屈を、
ひねり出すことになります。
これで、「精度の高い売上予測」なんて、できるはずもありません。
30年前にはこのことに気付かず、盲目的に「簡単に売上予測ができる」という幻想に、あわや騙されてしまうところでした。
「統計上」は精度が高いように見えても、論理的に、矛盾や問題点を抱えている売上予測モデルは、実際には決して使い物になりません。
そのことを、経験上身に染みて分かっていました。
そうして、30余年・・・・様々なソフトウェアが生まれ、便利になってきた今になっても、その手法のまま、売上予測を続けています。
結局、 ソフトウェアがどんなに便利になろうと、「お店の立地」の分析とは、「人の心」の分析です。
結局のところ、人が自分の頭で考え、手と目を使って分析すること以上に、精度が高くなる手段なんて、無いのです。
昨今、 今度は「AI」が台頭してきました。
頭ごなしに、そういう技術的な革新を否定することはいたしません。
けれども、「AIなら高精度売上予測ができるはずだ」というように、盲目的に捉えてしまうことには、 警鐘を鳴らしたい。
人が使いこなせばこそ、道具は真価を発揮しますが、機械は、どんなに賢くなっても、
(SFのように心を持つ機械が生まれるのはまだずっと先ですから)
人の心を捉えることはできません。
そのことを、 忘れないようにいてください。AIに頼り過ぎれば、出店システムの崩壊を招きかねません。そうならないためには、それを使う人・・・・
すなわち店舗開発部員や出店調査部員のスキルを、高めていくことが必要不可欠です。
私は、立地と高精度/売上予測で「不振店」を根絶します。
有)ソルブ 林原安徳
◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆
「重回帰分析の方法」の関連リンク
●売上予測を重回帰分析で行う手法 1
●t値が大事です。(売上予測を重回帰分析で行う手法2)
●修正済み相関係数とは(売上予測を重回帰分析で行う手法3)
●目的変数の決め方(売上予測を重回帰分析で行う手法4)
●残差分析で考える(売上予測を重回帰分析で行う手法5)
●マルチコに気をつけよ(売上予測を重回帰分析で行う手法6)
●感性を数値化せよ(売上予測を重回帰分析で行う手法7)
●立地指数の出し方(売上予測を重回帰分析で行う手法9)
●商圏分断を数値化する(売上予測を重回帰分析で行う手法10)
●商圏拡大を数値化する(売上予測を重回帰分析で行う手法11)
●ダミー変数が役に立つ(売上予測を重回帰分析で行う手法13)
●売上予測のフォーマット(売上予測を重回帰分析で行う手法14)
●売上予測値と実際の理論値の差を計算する(売上予測を重回帰分析で行う手法15)
●エクセルを活用しよう 1(売上予測を重回帰分析で行う手法16)
●エクセルを活用しよう 2(売上予測を重回帰分析で行う手法17)
●売上予測モデルはいくつ作れば良いか?(売上予測を重回帰分析で行う手法18)く
●売上予測フォーマット(売上予測を重回帰分析で行う手法19)
●売上予測をエクセルで実現する (売上予測を重回帰分析で行う手法20)
●重回帰分析の出来は、データの多さでなく、残差分析の深さで決まる。
●高精度/売上予測モデルはエクセルで分析したら、エクセルで運用した方が良い2つの理由。