くものしゅの日記

子育て中の ph. D.です。専門は確率統計.情報理論等

山登り 一人で登ろうとするけど、、、

うちの赤ちゃん、歩くの大好き。
足腰もだいぶん強くなってきました。
最近では公園の小山を登ろうとします。
でも、ちょっと危ないです。
ゆるやかな傾斜ならいいんですけど、
結構、急こう配で、正直危ない小山です。
赤ちゃんが登るのは無理。
無謀な山登りなんですけど、
赤ちゃんは諦めません。
チャレンジするんです。
冒険家なんです。
登りたくて仕方がないようです。
そこに山があるから。
 
でも、一人では無理だから、大人が助けます。
赤ちゃんの後ろに立って両手をつないで支えてあげるんです。
急こう配でも手をつなげば登れるんです。
赤ちゃんの身体の傾きは山の斜面とほぼ直角で、
手を放したら転がり落ちる感じだけど、
それでも登れる感じ。
小山の頂上まで登ったり降りたりを繰り返しています。
 

f:id:kumonoshu:20180929211914j:plain

赤ちゃんが笑顔になる歌 ”The Subway Shake”

 
Youtube って楽しいですね、
って前の記事にも書きましたけど、
ほんと、重宝します。
 
 
最近の、うちの赤ちゃんのお気に入りの曲。
 
 
なんだか、楽しそう。
Boom chicka boom chicka, boom boom boom
この部分がお気に入りみたい。
私が歌っても、赤ちゃん、笑顔になります。 
 
ブンチカブンチカ、ブンブンブン♪
覚えやすくて、耳に残る歌詞ですね。
どういう意味か調べたくなりました。
 
という訳で、
boom chicka
の意味調べてみたところ、
 
boom ってのは地下鉄が走る音、ブーン
chickaは・・・・特に意味ないみたい。
 
まあ、地下鉄の曲だから チカって覚えれば覚えやすいね。
ブンチカ♪
 

歯磨き時のローリング

うちの赤ちゃん。乳歯ずいぶん増えてきたから、
寝る前に歯磨きしてるんですけど、
赤ちゃんが嫌がるんです。
うぁーーーっっ!!
て叫んでます。
でもまあ、最近は慣れました。
うぁーーーっっ!!
て叫ぶけど、
口を開けて歯を磨かせてくれます。
 
でも、少し前は、大変だったんです。
歯みがきの為に仰向けにしようとしても、
どうしても抑え込めない。
ブリッジしてローリングで逃れようとするんです。
まるでレスリングの試合。
腹這いで防御してる赤ちゃんをどうやってフォールするのか。
大変です。
あっ、フォールっていうのは、
レスリングで選手の両肩がマットにつくことで、
つけられた方が負けになるんです。
もう、大変。毎晩がレスリング。
目指せ、日本代表、って感じです。

f:id:kumonoshu:20180929212751j:plain

正規分布 その4:正規分布する、という場合には2通りある。現実の分布と理論の分布。

 
正規分布とは、こんな形のグラフです。
横軸が測定値、縦軸が人数と思って下さい。
 

 
この正規分布の山の形は、
数学的に厳密に決まっています。
山の曲がり具合とかも、
数学的に正確に決まっているのです。
 
ここで理解しておいた方が良いポイントとしては、
数学の理論として正規分布という形のグラフがある、ということです。
理論上のグラフだから、綺麗な形をしています。
 
一方、現実に何かを測定してグラフを作成したときは
グラフの形は正規分布と比べて凸凹とした形になるでしょう。
 
しかし、凸凹してるけど、なんだか正規分布っぽい形をしている、
ってことがあるんです。
そういうとき、多少の誤差はあるけど、似たような形だから
正規分布してるとみなしてしまうことがあります。
多少の誤差は気にしない、ってことです。
 
例えば、同年代同性の身長のグラフはこんな感じです。
 

 
正規分布っぽいですよね。
だから、身長のグラフは正規分布の形をしている、って考えていいです。
これを「身長は正規分布に従う」って言ったりもします。
分布に従う、って言い方はなんだか不思議な表現ですが、
まあ、専門用語だと思ってください。
 
 
正規分布は数学の話ですので、数学的にいろいろと計算して、
様々なことが分かっています。
数学の理論上、正規分布する、ということが分かっているものもあります。
あくまでも理論上ですので、現実に何かを測定してグラフを作成する、
という話ではありません。
 
数学の理論としての正規分布が何の役にたつのかといいますと、
理論上正規分布するのなら、現実でも正規分布するだろう、
と予想できるようになるということです。
 
 
今回の話をまとめるとこんな感じです。
 
正規分布する、という場合には2通りある。
  1. 現実のグラフ(例えば身長のグラフ)が正規分布っぽい形をしている場合。
  2. 数学の理論上、正規分布すると分かっている場合。
 
1は現実の話。2は理論の話です。
 
 
今回で正規分布については一区切りとします。
 
質問・疑問等がありましたら、お気軽にコメントしてください。
 
 
<あとがき>
 
正規分布を理解する際のポイントは、
「平均と標準偏差
です。
重要な点は次の2つです。
 
  • 平均と標準偏差の値が分かっているとき、正規分布の形が決まる
  • 平均と標準偏差の値が分かっているときパーセンタイル値が求められる。 
 
詳しくは過去記事を見てください。
標準偏差については、以下をご覧ください。

正規分布 その3:平均と標準偏差が決まるとパーセンタイル値を求められる

平均と標準偏差を使って
身長が大きいか小さいか
おおざっぱに判断をすることができます。
 
平均 ー3×標準偏差 結構小さい
平均 ー2×標準偏差 小さい
平均 ー1×標準偏差 普通の中では小さい
平均        普通
平均 +1×標準偏差 普通の中では大きい
平均 +2×標準偏差 大きい
平均 +3×標準偏差 結構大きい
 
の意味が分からない人は過去記事をみてください。
 
過去記事
平均と標準偏差 その1:大雑把に大きいか小さいかが分かる
身長の大きさって、小さい順に並んだとき前から何番目にいるのか、
ということで判断できますよね。 
正規分布の特徴の1つは、平均と標準偏差を使って
身長の順番を求めることができることです。
ここでは、 パーセンタイル値を使って順番を求める方法を説明します。
 
パーセンタイル値とは:
データを小さい順に並べて、前から数えて〇〇パーセントの場所にある値を〇〇パーセンタイル値と呼びます。〇〇には0から100の間の数が入ります。
 詳しくは過去記事  パーセンタイル値とテストの成績  をみてください。
 
 
正規分布のパーセンタイル値について簡単に説明します。
下のグラフをみてください。
グラフの縦軸を人数と思ってもいいのですが、
「面積が人数」と思う方が理解しやすいでしょう。
 

 
これは平均が60、標準偏差5の正規分布です。
平均体重60kgの人たちのグラフだと思えばイメージしやすいかもしれません。
 
灰色に塗られた部分に注目してください。
小さい順で並んだとき55kg より軽い人たちが灰色の部分にいます。
正規分布の場合、灰色の面積はどのくらいの大きさか計算することができます。
今回の例では、山全体の面積を100%としたとき、
灰色の部分の面積は15.9%になります。
小さい順に並んだとき前から15.9%のところに55kgの人がいる、ということです。
 
この結果から、
15.9パーセンタイル値は55kg 
となります。
 
15.9という数自体にそれほど意味はありません。
 灰色部分の面積を数学的に計算すると全体の15.9%になった、
というだけです。
 灰色部分の面積の計算方法は覚える必要はありません。
 
ここで重要な点は、
正規分布の場合、パーセンタイル値を求めることができる
ということです。
ただし、平均と標準偏差の値が分かっていないと
パーセンタイル値を求めることはできません。
 
パーセンタイル値が幾つになるのかは、
次の表のようにまとめられます。
 

〇%

〇パーセンタイル値

0.1%

平均 ー3×標準偏差

2.3%

平均 ー2×標準偏差

15.9%

平均 ー1×標準偏差

50.0%

平均

84.1%

平均 +1×標準偏差

97.7%

平均 +2×標準偏差

99.9%

平均 +3×標準偏差

 注) この表は正規分布するときのみ正しいです。

 
表中の細かい数字の意味は気にしなくてよいです。
 
この表の使い方を覚えたほうが良いです。
 
 
この表の使い方を具体例を使って説明したいと思います。
 
 
「身長は正規分布する」と統計の世界で扱われることが多いので、
身長を例に説明します。
 
例えば、
2015年度の女児の身長の平均値と標準偏差は下表のとおりです。
f:id:kumonoshu:20180705121350j:plain
 
 
例えば、女子、幼稚園(5歳)の場合、
平均は 109.4 cm
標準偏差は 4.66 cm
ですので
 
109.4 - 3×4.66 = 95.42 cm
より身長が低い人は全体の 0.1%
 
109.4 - 2×4.66 = 100.08 cm
より身長が低い人は全体の 2.3%
 
109.4 - 1×4.66 = 104.74 cm
より身長が低い人は全体の 15.9%
 
109.4 cm
より身長が低い人は全体の 50.0%
 
109.4 + 1×4.66 = 114.06 cm
より身長が低い人は全体の 84.1%
 
109.4 + 2×4.66 = 118.72 cm
より身長が低い人は全体の 97.7%
 
109.4 + 3×4.66 = 123.38 cm
より身長が低い人は全体の 99.9%
 
と判断すると良いです。
表にまとめるとこうなります。
 

〇%

身長

0.1%

95.42 cm

2.3%

100.08 cm

15.9%

104.74 cm

50.0%

109.4 cm

84.1%

114.06 cm

97.7%

118.72 cm

99.9%

123.38 cm

 
例えば、自分の子が5歳の女児で 115 cmだったとします。
このときは、
 
上の表を見ると114.06 cmよりも低い人が全体の84.1%だから、
100人が小さい順にならんだとき、 
前から84番目が約114 cmってことだよなぁ・・・
ん!?
ってことは、自分の子は115cmだから
84番目よりちょっと後ろにいるってことか~!
 
って感じになります。
 
 
ところで、115 cmの子が前から何番目にいるのかを、
もっと正確に求めることもできます。
その方法に興味がある方は過去記事をご覧ください。
 
過去記事
平均と標準偏差 その3:平均と標準偏差を使ってパーセンタイル値を求める方法
 
今回はここまでにしたいと思います。
 
質問・疑問等がありましたら、お気軽にコメントしてください。

正規分布 その2:平均と標準偏差が決まるとグラフが描ける

正規分布って統計とかで出てくるけど、
これが出てきたら、思い出すべき用語があります。
それは、
 
平均と標準偏差
 
です。
標準偏差とは何?って思う人は過去記事を見てください。
 
正規分布には平均と標準偏差が付きものです。
これがない、ってことはあり得ません。
それくらい、
 
平均と標準偏差
 
は大事なものです。
 
次に、思い浮かべて欲しいのは、
山の頂上が真ん中にあり、左右対称になだらかに減っていくグラフ。
 

 
この形のグラフを正規分布と呼びます。
 
さて、このグラフに2つの記号が書いてありますね。
 
 μ はミュー
 σ はシグマ
 
と呼びます。これは平均と標準偏差のことです。
 
平均、標準偏差とグラフの中に書くのは難しいので
 
 μ = 平均
 σ = 標準偏差
 
と短い表現に書き直した、と思ってください。
 
 
具体例で説明したほうが分かりやすいと思いますので、
今回は身長を身体測定した、という話に例えて説明します。
 
同学年で同性の人達の身長を測定した結果を
横軸が身長、縦軸が人数のグラフで表すとします。
このグラフが
 
 
という形をしているとします。
 
μ は平均身長。 σ は身長の標準偏差です。
 
高学年になるほど平均身長が大きいですよね。この場合、μ が大きくなります。
 
標準偏差とはバラツキの大きさと思ってください。
標準偏差 」という単語を「バラツキ」と読み替えてみましょう。
 
標準偏差が小さいとき、身長のバラツキが小さい。
標準偏差が大きいとき、身長のバラツキが大きい。
 
同じような身長の人ばかりのグラフを描くときは、σは小さいです。
身長差がある人達のグラフのときは、σ は大きくなります。
 
このように、 μ と σ の値に応じて身長のグラフを描くことになります。
例えば
μ=130cm、σ=10cm
のときは
μーσ=120、μ+σ=140 ですので、次のようになります。
 

 
 
 
μ=130cm、σ=5㎝
のときは
μーσ=125、μ+σ=135 ですので、
 

f:id:kumonoshu:20181013203220j:plain

 
σが小さいとき、身長のバラツキが小さいので、
多くの人が平均130cmと似たような身長です。
130cm 付近に大勢の人がいることを表したいときは、
細くて高い山を描くと良いでしょう。
 
 
重要なのは次のことです。
  • μとσの値が決まれば、具体的に1つの身長のグラフを描くことができる。
 
今回の話は
 正規分布≒身長のグラフ
で例えて解説しました。
 
まとめ
  • μとσの値が決まれば、具体的に1つの正規分布が定まる。
 
 
 
母平均と標本平均
身長を考えるとき、統計では平均は2つあります。
母平均と標本平均です。
母平均は全員の身長を平均したものです。
でも、全員の人数が多すぎて身長を調べられないことがあります。
このとき、全体から少しずつ人を選び出して、
その人たちの身長を平均することがあります。
これを標本平均といいます。
 
統計では、母平均を μ と書くことが多いです。
 
 
今回はここまでにしたいと思います。
 
質問・疑問等がありましたら、お気軽にコメントしてください。

正規分布 その1:平均値が決まっているとき、どんなグラフになる?

正規分布って何?
って思うことありますよね。
 
まあ、難しいこと抜きにして、
正規分布は平均値について考察するときに出てくる用語です。
 
平均値というのは、いわゆる平均。
例えば、平均点とかそういうのです。
 
正規分布が何の役に立つのか、
ということは別の記事に書くことにします。
 
今回は、正規分布とは何か、ということをテストの点を例に説明したいと思います。
 
横軸を点、縦軸を人数としたグラフを描きたいとします。
 
では、 平均点を60点だとして、
テストの点のグラフを想像してみてください。
平均60点だからといって、60点の人数が多いとは限りません。
 
例えば

 
このグラフ、真ん中に60点があるので、
平均60点になっています。
 
でもなんだか不自然ですね。
何で、平均近くの人がいないの?って気がします。
何か理由があるの?って聞きたくなりますね。
 
 
では、こんなのはどうでしょう?
これも平均60点です。
 

 
悪くはないけど、50点以下の人が突然いなくなるのは不思議ですね。
70点以上の人も突然いなくなります。
 
もっと、自然な感じに描いてみましょう。
次のグラフも平均60点です。

 
さっきよりましだけど、
平均60点の人よりも、
平均より低い56点辺りの人の人数が多いですね。
 
平均より低い人の方が多い理由は何かあるの?
って聞きたくなります。
 
 
では、次のはどうでしょう?
 

 
平均点の所に山の頂上があり、左右対称になだらかに減っていくグラフ。
平均60点のテストのグラフというと、
こういうのをイメージする人が多いと思います。
このグラフ(4)を正規分布と呼ぶと思ってください。
 
まとめ
 
この理解で大体OKです。
 
 
 
ここからは、ちょっと補足。
 
今回の話は、分かりやすくする為に、テストの点の話にしました。
実は、テストの点のグラフは(4)のようになるとは限りません。
(1)(2)(3)のようになることもあり得ます。
 
 
テストの点の場合、
0点未満はあり得ないとか、
100点より上の人はいないよねとか、
グラフを描く際に色々な条件が付け加えられます。
このような条件のおかげで、
より正確なグラフが描けるようになります。
 
例えば、学力が2極分化している場合は、
グラフ(1)のように描いた方が良いでしょう。
 
このようにテストの点のグラフは、
「平均値以外の条件」も使って描くことがありますので、
必ずしも正規分布になるわけではありません。
 
 
正規分布t分布、F分布
統計では正規分布以外にも、t分布、F分布といったものが出てきますが、
その基本は正規分布なのです。
だから、正規分布は重要なんです。
 
 
今回はここまでにしたいと思います。
 
質問・疑問等がありましたら、お気軽にコメントしてください。