048-711-7195
107-0062 東京都港区南青山2-2-15-942
月~金 9:00~18:00
標準偏差の意味は簡単です。それは〇〇〇〇を表す。
実は、平均値とか、合計、個数という数学用語も、統計学の用語(統計用語)である。
平均値をA、合計をS、個数をnで表したら、A=S÷n という数式が成り立つ。
同じように、「標準偏差」も統計用語である。
ところが、標準偏差という用語は、中学校はおろか、高校の数学でさえ教えてくれないから、知らない社会人は多い。
しかし、この「標準偏差」こそ、とても大事な統計用語の一つである。
その意味は簡単で、「バラツキ」だ。
ここに、n個の数字があったとする。その数字の合計はSである。そして、平均はAである。
で、そのn個の数字だが、例えば、全部の数字が、Aであっても 平均値はAになるし、逆に、ぜんぜん異なる数字がいっぱいあっても、平均値がAとなることはある。
具体的に言えば、「3、3、3、3、3」と3が5個あっても、平均値は3であると同時に
「1、2、3、4、5」と3以外の数字が5個あっても、平均値は3である。
しかし、「3、3、3、3、3」と「1、2、3、4、5」は明らかに異なる数字の集まりである。しかし、両者は、A=3であるばかりか、S=15、n=5 でもある。
つまり、この二つの集まりを区別できない。
そこで、出てくるのが、標準偏差である。要するにバラツキが違う。
バラツキを計算できれば、何とか区別できそうだ。そこで、このバラツキ:標準偏差を、各々の数字と平均値との差 という計算をしてみる。
つまり、各々の数字-平均値 を行ってみると、
「3、3、3、3、3」の方は、「3-3、3-3、3-3、3-3、3-3」=「0、0、0、0、0」
「1、2、3、4、5」の方は「1-3、2-3、3-3、4-3、5-3」=「-2、-1、0、1、2」
となり、そのバラツキがあることがわかります。
このバラツキを一つの数字で表現するにはどうしたら良さそうです。ぜんぶの数字を単に足してみましょうか?そうすると、両方とも「0」になってしまいます。
そりゃ、そうです。後者の数字の集まりは、プラスとマイナスがほぼ同じだけ含まれています。ほんとは「ほぼ」ではなく「ぴったり」なのですが・・・
だから、プラスとマイナスが相殺され「0」になってしまうわけです。
そこで、統計学者は考えます。「そうだ。ぜんぶ二乗してしまえ」。二乗すると、マイナスの数字も必ずプラスになります。だから、後者の集まりは「(-2)の二乗、(-1)の二乗、0の二乗、1の二乗、2の二乗」=「4,1,0,1,4」という数字になりました。この中の数字を合計すると、10です。
これを、合計のときと同じように、5で割ります。10÷5=2
やりました。この2という文字がバラツキを表している・・。確かに、バラツキを表しているのですが、こうして出した数字は、標準偏差とは言わず、「分散」と呼んでいます。
標準偏差は、この分散を0.5乗、つまり、「(分散を合計して、平均値の時と同じように、nで割った数字)の平方根」というふうに定義したのです。
2の平方根ですから、標準偏差は1.414214・・・です。
これで、バラツキを意味する統計用語を定義することができました。
ちなみに、エクセルの関数では、合計は=SUM(範囲)でした。標準偏差の場合は、=STDEV.P(範囲)です。
(.Pを無くしてしまうと、正しい標準偏差は出ませんので注意してください)
有限会社ソルブ
電話番号:048-711-7195 住所 〒338-0002 埼玉県さいたま市中央区下落合四丁目17番18号
23/06/12
22/05/20
21/12/30
21/08/04
21/08/03
21/08/01
21/07/31
21/07/10
21/07/09
21/07/08
TOP
標準偏差の意味は簡単です。それは〇〇〇〇を表す。
実は、平均値とか、合計、個数という数学用語も、統計学の用語(統計用語)である。
平均値をA、合計をS、個数をnで表したら、A=S÷n という数式が成り立つ。
同じように、「標準偏差」も統計用語である。
ところが、標準偏差という用語は、中学校はおろか、高校の数学でさえ教えてくれないから、知らない社会人は多い。
しかし、この「標準偏差」こそ、とても大事な統計用語の一つである。
その意味は簡単で、「バラツキ」だ。
ここに、n個の数字があったとする。その数字の合計はSである。そして、平均はAである。
で、そのn個の数字だが、例えば、全部の数字が、Aであっても 平均値はAになるし、逆に、ぜんぜん異なる数字がいっぱいあっても、平均値がAとなることはある。
具体的に言えば、「3、3、3、3、3」と3が5個あっても、平均値は3であると同時に
「1、2、3、4、5」と3以外の数字が5個あっても、平均値は3である。
しかし、「3、3、3、3、3」と「1、2、3、4、5」は明らかに異なる数字の集まりである。しかし、両者は、A=3であるばかりか、S=15、n=5 でもある。
つまり、この二つの集まりを区別できない。
そこで、出てくるのが、標準偏差である。要するにバラツキが違う。
バラツキを計算できれば、何とか区別できそうだ。そこで、このバラツキ:標準偏差を、各々の数字と平均値との差 という計算をしてみる。
つまり、各々の数字-平均値 を行ってみると、
「3、3、3、3、3」の方は、「3-3、3-3、3-3、3-3、3-3」=「0、0、0、0、0」
「1、2、3、4、5」の方は「1-3、2-3、3-3、4-3、5-3」=「-2、-1、0、1、2」
となり、そのバラツキがあることがわかります。
このバラツキを一つの数字で表現するにはどうしたら良さそうです。ぜんぶの数字を単に足してみましょうか?そうすると、両方とも「0」になってしまいます。
そりゃ、そうです。後者の数字の集まりは、プラスとマイナスがほぼ同じだけ含まれています。ほんとは「ほぼ」ではなく「ぴったり」なのですが・・・
だから、プラスとマイナスが相殺され「0」になってしまうわけです。
そこで、統計学者は考えます。「そうだ。ぜんぶ二乗してしまえ」。二乗すると、マイナスの数字も必ずプラスになります。だから、後者の集まりは「(-2)の二乗、(-1)の二乗、0の二乗、1の二乗、2の二乗」=「4,1,0,1,4」という数字になりました。この中の数字を合計すると、10です。
これを、合計のときと同じように、5で割ります。10÷5=2
やりました。この2という文字がバラツキを表している・・。確かに、バラツキを表しているのですが、こうして出した数字は、標準偏差とは言わず、「分散」と呼んでいます。
標準偏差は、この分散を0.5乗、つまり、「(分散を合計して、平均値の時と同じように、nで割った数字)の平方根」というふうに定義したのです。
2の平方根ですから、標準偏差は1.414214・・・です。
これで、バラツキを意味する統計用語を定義することができました。
ちなみに、エクセルの関数では、合計は=SUM(範囲)でした。標準偏差の場合は、=STDEV.P(範囲)です。
(.Pを無くしてしまうと、正しい標準偏差は出ませんので注意してください)
●t値が大事です。(売上予測を重回帰分析で行う手法2)
●修正済み相関係数とは(売上予測を重回帰分析で行う手法3)
●マルチコに気をつけよ(売上予測を重回帰分析で行う手法6)
●数字には種類がある(売上予測を重回帰分析で行う手法12)
●ダミー変数が役に立つ(売上予測を重回帰分析で行う手法13)
●標準偏差の意味は簡単です。それは〇〇〇〇を表す。
有限会社ソルブ
電話番号:048-711-7195
住所 〒338-0002
埼玉県さいたま市中央区下落合四丁目17番18号