くものしゅの日記

子育て中の ph. D.です。専門は確率統計.情報理論等

平均と標準偏差 その3:平均と標準偏差を使ってパーセンタイル値を求める方法

平均と標準偏差は便利な道具です。
例えば身長が大きいか小さいか判断をすることができます。
 

kumonoshu.hatenablog.com

 

でも、この判断。
分かりやすいようで、分かり辛い判断なんです。
例えば、その1では
「平均 +3×標準偏差」のとき結構大きい
と判断すると書きましたが、
 
「結構大きいってどういうこと?」
 
って思いませんか?
「結構大きい」ってなんだか曖昧な表現です。
もっと、具体的なことが分かるといいですよね。
 
大きいとか小さいとかそういう曖昧な表現ではなく、
例えば100人が小さい順に並んだとき、
前から数えて何番目に自分が並ぶことになるのか。
これが分かるとよいですね。
 
実は、100人の集団がある条件を満たすとき、
何番目に並ぶことになるかが分かるようになります。
 
 
ある条件とは何かといいますと、
「100人の集団が正規分布する」
ということです。
 
正規分布」って何ですか、と思う人もいると思います。
しかし、正規分布について説明すると文章が長くなりますので、
今回は説明を省略します。
難しいことは抜きにして、
 
 集団の特徴の一つに「正規分布」というものがある
 
と思ってください。
 
自分が所属している集団が「正規分布」という特徴を持つとき、
平均と標準偏差を使って自分のパーセンタイル値が求められるようになります。
 
パーセンタイル値とは:
データを小さい順に並べて、前から数えて〇〇パーセントの場所にある値を〇〇パーセンタイル値と呼びます。〇〇には0から100の間の数が入ります。
データ x が何パーセンタイル値であるかをエクセルを使って求める方法:
 
Excelのセルに
 
 =NORM.DIST(x,平均,標準偏差,TRUE)
 
と入力すると、x が何パーセンタイル値であるかが分かります。
 
以前、平均と標準偏差を使って大きいか小さいかを大雑把に判断しました。
今回は、パーセンタイルを求めてみましょう。
 
例:
2015年度の学校保健統計調査(文科省)によると
女子、幼稚園(5歳)の身長は以下の通りです。
 
平均は 109.4 cm
標準偏差は 4.66 cm
 

f:id:kumonoshu:20180705121350j:plain

 
自分の子が5歳の女児で 115 cmとします。
Excelのセルに
 
 =NORM.DIST(115, 109.4, 4.66, TRUE)
 
と入力すると、0.885 と表示されるので、
115 cm は 88.5パーセンタイル値です。
100人が小さい順に並んでいる場合、
前から数えて88人位の所に115 cm の子がいる、という感じです。
 ↑
これは身長が正規分布するとき正しいです
  
 
まとめ
  • 平均と標準偏差を使ってパーセンタイル値が求められる

 

次回に続く。
 
 
関連記事