都道府県を分類して、売上予測モデルを作る

(有)ソルブ 林原安徳

048-711-7195

lv

都道府県を分類して、売上予測モデルを作る

売上予測

2017/12/31 都道府県を分類して、売上予測モデルを作る

都道府県を分類して、売上予測モデルを作る。

 

これは珍しいだろう。しかし、いずれはやる時があると思っていた。

全国版の売上予測モデルを作る場合、通常は、感覚で地域を分けるものだ。

しかし、ほんとうにそれで良いのか?良いはずがない。

 

では、どうしたら良いだろうか?

全国、47都道府県を統計学的に分類することが必須である。

では、都道府県をどうやって分類するのか?それには、クラスター分析が必須である。

これは、統計的に、分類軸を使って、その軸に対して離れている、近いということを判別して分類するのである。

例えば、「性別」という分類軸を使って、男性と女性を分ける。「各種の血液検査」という分類軸を使って、「病気」「未病」「健康」を分けるみたいに。

では、この分類軸はどうやって準備するのか?

それはまず生のデータをたくさん用意して、それを「主成分分析」にかければ良い。

 

例えば、私がいまおこなっている分析では、

道路延長/車1万台、貯蓄額/世帯、鉄道輸送量/人、乗合バス量/人、年間降雪量、貧困率、県民所得万円/人
サラリーマン年収、可住地面積、年間真夏日数、交通事故件数、○○係数、20単身比率%、パチンコ台数比率
○○比率、自転車保有率、1人当たりGDP、癌死亡率(男10万)、1人当り森林、年間雨日数、10万人当り駅数
全学テスト正答率、人口密度、可住地人口密度、刑法犯認知件数

の25項目を”適当に”選んだ。

”適当に”で良いのか、と言われそうだが、それはそれで良い。”全て”を揃えるということは不可能だからだ。

どこかで、あやふやさは仕方ない。これを”あやふやさ”で終わらせないようにする統計学的加工が、主成分分析だからである。

この主成分分析では、25の主成分(軸)が見つかるが、そのうちの大部分は、統計学的に意味がないものになる。

 

結果的に、6個の主成分が見つかり、その6個の主成分を軸にして、クラスター分析を行った結果、47都道府県は、〇〇個に分類できることがわかった。

これは、小さからぬ”発見”である。

 

ちなみに、主成分1と主成分2で、散布図を描くと次のようになる。

 

なんと、”東京都”と”沖縄県”の2つが、まとまりから離れたところにある。つまり、この2つこそ、日本の中で最も”異質”な地域ということになる。

 

”そんなこと、誰だってわかるさ”と言うかもしれないが、

”誰だってわかること”を数値化した結果で示すことができる。これが重要なことである。

tokyookinawa

 
「売上予測」の関連記事20180105時点
●成長し続ける立地戦略とは、売上予測をすることです!
●なぜ売上予測が必要なのか(勘と経験でもいいのでは)
●立地が悪くても高い売上、立地が良くても低い売上ということはありますか?
●売上予測の手法 その1 回転率法
●売上予測の手法 その2 キャッチ率法
●「1週間でできる立地判定」【第8回】売れている店の隣はいくら売れるか  月刊コンビニ連載2013年8月号
●売上予測の手法 その3 市場シェア率法
●売上予測の手法 その4 比較法
●売上予測の計算はこうやって行う(1)
●売上予測計算はこうやって行う (2)
●売上予測の方法 勘と経験、そして度胸の問題
●売上予測はエクセルの関数を使ってもできることはできる。
●売上予測モデルを運用するフォーマットを作るのは難しい。
●売上予測モデルで一番大事な変数は、目的変数である。
●売上予測計算の必要性はどこから生まれたか?
●都道府県を分類して、売上予測モデルを作る

 

有限会社ソルブ

電話番号:048-711-7195
住所 〒338-0002
埼玉県さいたま市中央区下落合四丁目17番18号

TOP