標準偏差の意味は簡単です。それは〇〇〇〇を表す。

売上予測 30年の実績

048-711-7195

107-0062 東京都港区南青山2-2-15-942

月~金 9:00~18:00

lv_r

標準偏差の意味は簡単です。それは〇〇〇〇を表す。

統計

2017/12/18 標準偏差の意味は簡単です。それは〇〇〇〇を表す。

標準偏差の意味は簡単です。それは〇〇〇〇を表す。

 

実は、平均値とか、合計、個数という数学用語も、統計学の用語(統計用語)である。

平均値をA、合計をS、個数をnで表したら、A=S÷n という数式が成り立つ。

 

同じように、「標準偏差」も統計用語である。

ところが、標準偏差という用語は、中学校はおろか、高校の数学でさえ教えてくれないから、知らない社会人は多い。

しかし、この「標準偏差」こそ、とても大事な統計用語の一つである。

 

その意味は簡単で、「バラツキ」だ。

 

ここに、n個の数字があったとする。その数字の合計はSである。そして、平均はAである。

で、そのn個の数字だが、例えば、全部の数字が、Aであっても 平均値はAになるし、逆に、ぜんぜん異なる数字がいっぱいあっても、平均値がAとなることはある。

具体的に言えば、「3、3、3、3、3」と3が5個あっても、平均値は3であると同時に

「1、2、3、4、5」と3以外の数字が5個あっても、平均値は3である。

 

しかし、「3、3、3、3、3」と「1、2、3、4、5」は明らかに異なる数字の集まりである。しかし、両者は、A=3であるばかりか、S=15、n=5 でもある。

つまり、この二つの集まりを区別できない。

そこで、出てくるのが、標準偏差である。要するにバラツキが違う。

バラツキを計算できれば、何とか区別できそうだ。そこで、このバラツキ:標準偏差を、各々の数字と平均値との差 という計算をしてみる。

つまり、各々の数字-平均値 を行ってみると、

「3、3、3、3、3」の方は、「3-3、3-3、3-3、3-3、3-3」=「0、0、0、0、0」

「1、2、3、4、5」の方は「1-3、2-3、3-3、4-3、5-3」=「-2、-1、0、1、2」

となり、そのバラツキがあることがわかります。

このバラツキを一つの数字で表現するにはどうしたら良さそうです。ぜんぶの数字を単に足してみましょうか?そうすると、両方とも「0」になってしまいます。

そりゃ、そうです。後者の数字の集まりは、プラスとマイナスがほぼ同じだけ含まれています。ほんとは「ほぼ」ではなく「ぴったり」なのですが・・・

だから、プラスとマイナスが相殺され「0」になってしまうわけです。

そこで、統計学者は考えます。「そうだ。ぜんぶ二乗してしまえ」。二乗すると、マイナスの数字も必ずプラスになります。だから、後者の集まりは「(-2)の二乗、(-1)の二乗、0の二乗、1の二乗、2の二乗」=「4,1,0,1,4」という数字になりました。この中の数字を合計すると、10です。

これを、合計のときと同じように、5で割ります。10÷5=2

やりました。この2という文字がバラツキを表している・・。確かに、バラツキを表しているのですが、こうして出した数字は、標準偏差とは言わず、「分散」と呼んでいます。

標準偏差は、この分散を0.5乗、つまり、「(分散を合計して、平均値の時と同じように、nで割った数字)の平方根」というふうに定義したのです。

2の平方根ですから、標準偏差は1.414214・・・です。

これで、バラツキを意味する統計用語を定義することができました。

 

ちなみに、エクセルの関数では、合計は=SUM(範囲)でした。標準偏差の場合は、=STDEV.P(範囲)です。

(.Pを無くしてしまうと、正しい標準偏差は出ませんので注意してください)

stdev-p

TOP