重回帰分析 データには必ずミスが入り込むものです

売上予測 30年の実績

048-711-7195

107-0062 東京都港区南青山2-2-15-942

月~金 9:00~18:00

lv_r

重回帰分析 データには必ずミスが入り込むものです

売上予測

2019/01/13 重回帰分析 データには必ずミスが入り込むものです

売上予測をエクセルで極める その89 重回帰分析

 

分析ポイント(1)サンプル数は少ないところからはじめます。
サンプルが多ければ多いほど良いからといって最初から数百店調べようとする人がいます。
これは、統計解析を少しかじったことがある人に多く陥る罠です。確かに、理論上はこの通りなのです。10サンプル(10店舗)でモデルを作るより、20サンプル、30サンプルで作った方が高い精度の売上予測モデルを作ることができます。
しかし、だからといって、最初から100サンプル、あるいは全店300サンプルを使ってモデルを作ろうとするのは実践的ではありません。
業種業態によって、良い立地、悪い立地というのは微妙に、あるいは大きく異なってきます。
立地条件をどのように定義するか、どのように数値化するかで出来上がるデータは異なってきます。それなのに、一律にこういうデータで行こうと決めつけて、データ収集をしてしまうとそれが間違っていたような場合、すべて、調査し直しということになります。
30店くらいだったら、取り直しもさほど苦ではないかもしれませんが、数百店ではとても簡単にはできるものではありません。
少ない数から始め、どのような立地データが役立つかわかるようになってきてからだんだんとサンプルを増やしていくことをお勧めします。
分析ポイント(2)データには必ずミスが入り込む。
どんなデータであっても、その調査、加工、分析は人間が行うものですから、その途中で必ずミスが入り込むものです。ですから、一つデータを作ったら必ず見直す習慣を付けましょう。
データの入っていない項目はないか、データが1行、1列ずれていないか、数字でなくて文字が入ってしまっているデータがないか、店舗名と照合して常識的なデータが入っているか(たとえば、A店は大型店なのに、面積として入力されたデータが小さければ、そのデータは間違っていると推測できますね)、
また、データを分析にかけた後のタイミングとして、分析者にとって、ひじょうに都合の良い結果が出たときは、まずそのデータを疑ってみることです。「本当にこのデータは正しいのだろうか」と疑うのです。どんなに疑っても問題がないことがわかって初めて喜びましょう。

TOP