数字には種類がある(売上予測を重回帰分析で行う手法12)

(有)ソルブ 林原安徳

048-711-7195

lv

数字には種類がある(売上予測を重回帰分析で行う手法12)

売上予測

2017/11/06 数字には種類がある(売上予測を重回帰分析で行う手法12)

売上予測の手法 その5 重回帰分析を使った売上予測 12 数字の種類

 

説明変数として用いる要素は、すべて「数字」でなければならない。

 

しかし、この数字は、4種類の数字があることを知っておく必要がある。

まず、私達が日常で使っている数字は、「尺度(しゃくど)」のことであり、仮想の概念ではなければ、物理学で用いられる概念でもない。

尺度なのだから、4種類に分類できる。

まず第一に、「名義尺度」と呼ばれる数字がある。

これは、たとえば、「左側を0、右側を1とする」とか、「社会人を1、主婦を2、学生を3、未就学児を4、失業者を5、その他を6とする」とかのように、それぞれの区分を、単に数字にしているだけで、「足すことも引くこともできない(四則演算ができない)」というか、足したり引いたりする意味がない。

また、数字の順序や大きさの違いも意味がない。

これらが。名義尺度である。

仮に、立地のチェックリストに、「店側車線は1、反対側車線は2」というように決めた場合ももちろん名義尺度だ。

 

第二は、順序尺度と呼ばれる数字である。

たとえば、温度。10度と20度では、20度のほうが温度が高い。そういう意味がある。しかし、これは順序尺度ではない。

これは、間隔尺度と呼ばれ、10度+1度 と、20度+1度 というように 両方における1度という間隔は同じである。だから、間隔尺度と呼ばれる。

では改めて、順序尺度とはどういう数字を指すのか。

たとえば、人々が何人もいる場合、背の低い順に番号を付けたとしよう。その番号こそ、順序尺度である。

つまり、数字の順序には意味があるが、数字同士の違いについては意味がない。1番の人と2番の人の間隔が、10番の人と11番の人との間隔は等しいわけでもない。

さて、改めて「視界性評価」という数字を眺めてみよう。3、2、1 と定義したはずだが、この順序は、視界性評価が高い順であることは確かなのだが、3と2の間の1という間隔と、2と1との間の間隔が同じということを示してはいない。店舗番号も順序尺度である。

 

第三は、間隔尺度と呼ばれる。

すでに記載したように、温度は間隔尺度である。また、日付(どこかの日付を基準にして経過した日付を指す場合)も間隔尺度と言える。

つまり、数字と数字の間隔に意味がある。日付なら間隔は正確に24時間である。

間隔尺度としての数字は、間違いやすいことがある。それは足したり引いたりできるという錯覚である、

それは、日付のような感覚尺度では、特に間違いやすい。「今日が5日で、今日から6日後は何日だ?」という質問にすれば、確かに「5+6=11だから、それは11日だ」と答えられるからに過ぎない。「5日付けの日記がある。ここには6日付けの書類がある。では、5日+6日は何か?」という問いには、どう答えるべきだろう。

また、温度も同じである。「ここに50度のお湯がある。そこに30度のお湯がある。50度と30度を足すとどうなるか?」という問いも意味を持たない。

 

第4は、そういう足したり引いたりができる(四則演算ができる)尺度としての数字がある。

たとえば、体重kg。あるいは、ボール投げの飛距離m。それらは、どちらも25kg+35kg とか、30m+20m という直截な計算が意味を持っている。

もちろん、売上予測で使う、売上、客数、売場面積、競合店の数とたくさんある。

この尺度を比例尺度と呼んでいる。

 

売上予測では、これら数字の尺度としての違いをよくよく理解しなければならない。これらをごっちゃにした分析はあまり褒めたものではない。

初心者の陥りやすい点でもある。

 

 

Colorful numbers background. 3d rendered illustration

Colorful numbers background. 3d rendered illustration

 

 

 

 

 

有限会社ソルブ

電話番号:048-711-7195
住所 〒338-0002
埼玉県さいたま市中央区下落合四丁目17番18号

TOP