重回帰分析の出来は、データの多さでなく、残差分析の深さで決まる。

有限会社ソルブ

048-711-7195

〒338-0002 埼玉県さいたま市中央区下落合四丁目17番18号

lv

重回帰分析の出来は、データの多さでなく、残差分析の深さで決まる。

売上予測

2018/01/11 重回帰分析の出来は、データの多さでなく、残差分析の深さで決まる。

重回帰分析の出来は、データの多さでなく、残差分析の深さで決まる。

 

私の会社に訪れた人でたいへん印象が残った人がいる。

たくさんの説明変数、確か、200~項目くらいの変数と、100店舗位のサンプル数をお持ちになって、

「これで、売上予測モデルを作っていただけませんか」と来られた人だ。

この方とは、その10年近く前に、やはり、売上予測モデル構築のためのプロジェクトを行っていた。

その後、そのプロジェクトに関わったメンバー(10人ほどいらした)のほとんどは、部署が変わるなどしていなくなっていた。

そのため、この人だけがその後続けてきて、そろそろ第二世代の売上予測モデルを作りたいと重回帰分析に取り組んだ矢先であった。

 

重回帰分析のやり方は、「残差分析」に尽きる。

重回帰分析で作られる重回帰モデルは、モデルであるから理論値を算出するだけに過ぎない。

当然ながら、実際の売上とは、差異が生まれる。

そこで、実際の値−理論値 を「残差」と呼んでいるが、この残差こそ、分析に関わる宝の山である。

zansa

重回帰分析してみるまでは、まったく不明だった説明変数が生まれるのも、この「残差」が発現するからである。

今まで、売れているA店と売れていないB店の立地の違いが何であるかを考えてきたが、

それが、「残差」が大きくプラスに出るC店と、マイナスに大きく出るD店との立地の違いを調べ、発想する必要に変わる。

 

この「残差」要因を見つけ出すことこそ、重回帰分析の真骨頂である。

しかも、この要因は、すでに用意してあったどんなデータとも異なっている、つまり、今までのデータは何の役にも立たない ことがほとんどなのである。

 

 

つまり、重回帰分析とは、最初にデータありきでは決してない。重回帰分析とは、最初に残差分析ありきである。

データの組合せをうまくやれば、答えが出る(重回帰モデルが作れる)というものではなく、

残差分析を真剣に行うからこそ、必要なデータが何であるのかがわかるのである。

この点は、弊社とプロジェクトを組んだ「高精度/売上予測モデル」構築メンバーには、口酸っぱくして伝えている。

しかし、冒頭の元プロジェクトメンバーの人は、その肝心なことを忘れてしまったようだ。

また、このことは、統計学を生業としている人達のほとんどは知らない。

統計学をどんなに勉強しても、高精度/売上予測モデルが作れない理由がここにある。

 

「重回帰分析の方法」の関連記事
●売上予測を重回帰分析で行う手法 1
●t値が大事です。(売上予測を重回帰分析で行う手法2)
●修正済み相関係数とは(売上予測を重回帰分析で行う手法3)
●目的変数の決め方(売上予測を重回帰分析で行う手法4)
●残差分析で考える(売上予測を重回帰分析で行う手法5)
●マルチコに気をつけよ(売上予測を重回帰分析で行う手法6)
●感性を数値化せよ(売上予測を重回帰分析で行う手法7)
●競合指数の出し方(売上予測を重回帰分析で行う手法8)
●立地指数の出し方(売上予測を重回帰分析で行う手法9)
●商圏分断を数値化する(売上予測を重回帰分析で行う手法10)
●商圏拡大を数値化する(売上予測を重回帰分析で行う手法11)
●ダミー変数が役に立つ(売上予測を重回帰分析で行う手法13)
●売上予測のフォーマット(売上予測を重回帰分析で行う手法14)
●売上予測値と実際の理論値の差を計算する(売上予測を重回帰分析で行う手法15)
●エクセルを活用しよう 1(売上予測を重回帰分析で行う手法16)
●エクセルを活用しよう 2(売上予測を重回帰分析で行う手法17)
●売上予測モデルはいくつ作れば良いか?(売上予測を重回帰分析で行う手法18)く
●売上予測フォーマット(売上予測を重回帰分析で行う手法19)  
●売上予測をエクセルで実現する (売上予測を重回帰分析で行う手法20) 
●重回帰分析の出来は、データの多さでなく、残差分析の深さで決まる。
有限会社ソルブ

電話番号:048-711-7195
住所 〒338-0002
埼玉県さいたま市中央区下落合四丁目17番18号

TOP