くものしゅの日記

子育て中の ph. D.です。専門は確率統計.情報理論等

昔の京大の教養課程の講義の雰囲気が分かるような気になる本:岩波の「確率・統計入門」

昔の京大の教養課程の講義の雰囲気が分かるような気になる、
そんな本があるんです。
 
「確率・統計入門」小針アキ宏 著、岩波書店
確率・統計入門

確率・統計入門

 

 

初版1973年。
著者は京都大学で確率統計の講義をしていた方で、
確率・統計の教科書として使われることを想定して書かれています。
恐らく、1年向けの講義が、この本に書かれているような内容だったのでしょう。
 
では、読んでみます。
 
1章1節 確率の概念。
 
たぶん、これが第1回の講義内容です。
「確率とは何であるのかを明らかにする」
ということが目的のようです。
 
1ページ目にコイン投げの話が書いてあります。
コインを投げて表が出るか裏が出るか、って話です。
気になるところを抜粋します。
 
`表が出る確率はいくらですか'という問に`1/2です'と答えてはいけないのであって・・・
 
あれっ?って思いませんか。
コイン投げは、表が出る確率1/2ですよね。
普通はそうです。
しかし、1/2と答えてはいけないと書いてあります。
これはびっくりしますね。
 
では、表が出る確率はいくらですかと聞かれたとき、
どう答えればよいのでしょうか?
 
この本には、こう書いてあります。
 
・・・`そんなことは、わからないので 1/2 としましょう。そう仮定すると実験とよく合うのです'と言うべきなのです。
 
 
そうですか。。。
 納得できない方もいるかもしれないけど、
とりあえず了解、としましょう。
それでは、続きを見てみましょう。
 
3ページ目には、箱に玉を入れる話があります。
箱に玉を入れる入れ方は何通りあるのか、
という話です。
順列、組合せとか、そういう話です。
ちょっと難しい話だと思いますか?
いいえ、違います。
 
かなり大変なことになっています。
 
3ページに「マックスウェルーボルツマンの統計」
4ページに「ボーズーアインシュタインの統計」、
フェルミディラックの統計」
という用語が出てきます。
統計力学の話です。
 
これは大変です。
1年の確率・統計の講義の初日に統計力学が出てくると想像してみてください。
学生は統計力学をまだ習っていないはずです。
にも拘らず、統計力学を例にして「確率とは何であるのか」を説明するのです。
この段階で分からなくなってきます。
確率って何なんですか?って気になってきます。
 
でも、それでいいのです。
というのも、
高校までに習った確率に関する常識を打ち砕き、
確率とは何であるのかということを考えさせる、
ということがこの節の目的だからです。
 
よくある大学1年向きの教科書の場合、
高校までの知識で素直に読めるように工夫されています。
それが教育上の配慮というものです。
でも、この本は違います。
そんなヌルイことはしません。
高校までの内容に疑問を持たせる、ということを最初にします。
 
 
どんな分野にも、初めての人向けの「入門書」と
専門家向けの「専門書」の2つがあると思うんですけど、
この教科書は、
「専門家向けにしか書かないような内容を、初心者向けに書いてみた本」
のように感じました。特に1章はそうです。
 
例えば、何の説明もなく「ルベーグ積分可能」という用語がでてきます。
ルベーグ積分って何?
って思う人は多いと思います。
そういう人のために、19ページの欄外にこう書いてあります。
 
 どうしても知りたければどれでもよいからルベーグ積分論の本を自分でみれば必ず書いてある。
 
 
こんな感じです。
この本の1章は難易度が高いです。
 
では、2章以降はどうか、
といいますと、
なんだかすごいです。。。
難易度がすごい、という訳ではありません。
1章が分からなくても、2章以降を理解することはできます。
安心してください。
 
 
では何がすごいか、というと、
著者の個性がすごい。
 
軽妙洒脱な文体で確率統計の解説がつづられています。
 
詳しくは本を読んでみてください。
 
確率・統計入門

確率・統計入門

 

 

 

赤ちゃんの靴が汚れたとき、どうする?洗濯機で洗っていい?乾燥機は?

うちの赤ちゃん。散歩が大好き。
靴を履いてお出かけします。
晴れの日はいいんですけど、
 
雨上がりの日とかだと、
靴は結構汚れたりします。
水たまりやぬかるみがお気に入り。
泥だらけになって遊んでます。靴も泥だらけ。
 
だから頻繁に洗いたいんですけど、
靴の説明書によると、
 
洗濯機を使ってはいけないみたいです。
 
どうしよう。
洗いたいんだけど・・・
 
手洗いしかダメ?
乾燥機使っちゃダメ?
 
なんだか、大変です。
今のところ、我が家の靴は、
ファーストシューズ1足だけ。
 
今のところ洗う方は手洗いでしてますが、
問題は乾燥です。
洗い替えが無いから、洗ったあと、すぐに乾燥したい。
すぐ履きたいのです。
 
説明書には
「風通しのよい日陰で乾燥させてください」
って書いてあるんですけど、
乾燥機を使って早く乾かしたいんです。
 
って思ってたら、
我が家の全自動洗濯乾燥機に
「ソフト乾燥」
というのがありました。
 
「ドラム槽を回転させずに、ゆり動かしながら乾燥」
 
やさしい感じで乾かしてくれます。
これは、なんだかいい感じです。
靴の説明書には
 
「強制乾燥は絶対におやめください」
 
って書いてあるから、
あくまでも自己責任だけど、
乾燥に関しては
ソフト乾燥を使用しても大丈夫そうです。
 
まあ、いいよね。たぶん。

山登り 一人で登ろうとするけど、、、

うちの赤ちゃん、歩くの大好き。
足腰もだいぶん強くなってきました。
最近では公園の小山を登ろうとします。
でも、ちょっと危ないです。
ゆるやかな傾斜ならいいんですけど、
結構、急こう配で、正直危ない小山です。
赤ちゃんが登るのは無理。
無謀な山登りなんですけど、
赤ちゃんは諦めません。
チャレンジするんです。
冒険家なんです。
登りたくて仕方がないようです。
そこに山があるから。
 
でも、一人では無理だから、大人が助けます。
赤ちゃんの後ろに立って両手をつないで支えてあげるんです。
急こう配でも手をつなげば登れるんです。
赤ちゃんの身体の傾きは山の斜面とほぼ直角で、
手を放したら転がり落ちる感じだけど、
それでも登れる感じ。
小山の頂上まで登ったり降りたりを繰り返しています。
 

f:id:kumonoshu:20180929211914j:plain

赤ちゃんが笑顔になる歌 ”The Subway Shake”

 
Youtube って楽しいですね、
って前の記事にも書きましたけど、
ほんと、重宝します。
 
 
最近の、うちの赤ちゃんのお気に入りの曲。
 
 
なんだか、楽しそう。
Boom chicka boom chicka, boom boom boom
この部分がお気に入りみたい。
私が歌っても、赤ちゃん、笑顔になります。 
 
ブンチカブンチカ、ブンブンブン♪
覚えやすくて、耳に残る歌詞ですね。
どういう意味か調べたくなりました。
 
という訳で、
boom chicka
の意味調べてみたところ、
 
boom ってのは地下鉄が走る音、ブーン
chickaは・・・・特に意味ないみたい。
 
まあ、地下鉄の曲だから チカって覚えれば覚えやすいね。
ブンチカ♪
 

歯磨き時のローリング

うちの赤ちゃん。乳歯ずいぶん増えてきたから、
寝る前に歯磨きしてるんですけど、
赤ちゃんが嫌がるんです。
うぁーーーっっ!!
て叫んでます。
でもまあ、最近は慣れました。
うぁーーーっっ!!
て叫ぶけど、
口を開けて歯を磨かせてくれます。
 
でも、少し前は、大変だったんです。
歯みがきの為に仰向けにしようとしても、
どうしても抑え込めない。
ブリッジしてローリングで逃れようとするんです。
まるでレスリングの試合。
腹這いで防御してる赤ちゃんをどうやってフォールするのか。
大変です。
あっ、フォールっていうのは、
レスリングで選手の両肩がマットにつくことで、
つけられた方が負けになるんです。
もう、大変。毎晩がレスリング。
目指せ、日本代表、って感じです。

f:id:kumonoshu:20180929212751j:plain

正規分布 その4:正規分布する、という場合には2通りある。現実の分布と理論の分布。

 
正規分布とは、こんな形のグラフです。
横軸が測定値、縦軸が人数と思って下さい。
 

 
この正規分布の山の形は、
数学的に厳密に決まっています。
山の曲がり具合とかも、
数学的に正確に決まっているのです。
 
ここで理解しておいた方が良いポイントとしては、
数学の理論として正規分布という形のグラフがある、ということです。
理論上のグラフだから、綺麗な形をしています。
 
一方、現実に何かを測定してグラフを作成したときは
グラフの形は正規分布と比べて凸凹とした形になるでしょう。
 
しかし、凸凹してるけど、なんだか正規分布っぽい形をしている、
ってことがあるんです。
そういうとき、多少の誤差はあるけど、似たような形だから
正規分布してるとみなしてしまうことがあります。
多少の誤差は気にしない、ってことです。
 
例えば、同年代同性の身長のグラフはこんな感じです。
 

 
正規分布っぽいですよね。
だから、身長のグラフは正規分布の形をしている、って考えていいです。
これを「身長は正規分布に従う」って言ったりもします。
分布に従う、って言い方はなんだか不思議な表現ですが、
まあ、専門用語だと思ってください。
 
 
正規分布は数学の話ですので、数学的にいろいろと計算して、
様々なことが分かっています。
数学の理論上、正規分布する、ということが分かっているものもあります。
あくまでも理論上ですので、現実に何かを測定してグラフを作成する、
という話ではありません。
 
数学の理論としての正規分布が何の役にたつのかといいますと、
理論上正規分布するのなら、現実でも正規分布するだろう、
と予想できるようになるということです。
 
 
今回の話をまとめるとこんな感じです。
 
正規分布する、という場合には2通りある。
  1. 現実のグラフ(例えば身長のグラフ)が正規分布っぽい形をしている場合。
  2. 数学の理論上、正規分布すると分かっている場合。
 
1は現実の話。2は理論の話です。
 
 
今回で正規分布については一区切りとします。
 
質問・疑問等がありましたら、お気軽にコメントしてください。
 
 
<あとがき>
 
正規分布を理解する際のポイントは、
「平均と標準偏差
です。
重要な点は次の2つです。
 
  • 平均と標準偏差の値が分かっているとき、正規分布の形が決まる
  • 平均と標準偏差の値が分かっているときパーセンタイル値が求められる。 
 
詳しくは過去記事を見てください。
標準偏差については、以下をご覧ください。

正規分布 その3:平均と標準偏差が決まるとパーセンタイル値を求められる

平均と標準偏差を使って
身長が大きいか小さいか
おおざっぱに判断をすることができます。
 
平均 ー3×標準偏差 結構小さい
平均 ー2×標準偏差 小さい
平均 ー1×標準偏差 普通の中では小さい
平均        普通
平均 +1×標準偏差 普通の中では大きい
平均 +2×標準偏差 大きい
平均 +3×標準偏差 結構大きい
 
の意味が分からない人は過去記事をみてください。
 
過去記事
平均と標準偏差 その1:大雑把に大きいか小さいかが分かる
身長の大きさって、小さい順に並んだとき前から何番目にいるのか、
ということで判断できますよね。 
正規分布の特徴の1つは、平均と標準偏差を使って
身長の順番を求めることができることです。
ここでは、 パーセンタイル値を使って順番を求める方法を説明します。
 
パーセンタイル値とは:
データを小さい順に並べて、前から数えて〇〇パーセントの場所にある値を〇〇パーセンタイル値と呼びます。〇〇には0から100の間の数が入ります。
 詳しくは過去記事  パーセンタイル値とテストの成績  をみてください。
 
 
正規分布のパーセンタイル値について簡単に説明します。
下のグラフをみてください。
グラフの縦軸を人数と思ってもいいのですが、
「面積が人数」と思う方が理解しやすいでしょう。
 

 
これは平均が60、標準偏差5の正規分布です。
平均体重60kgの人たちのグラフだと思えばイメージしやすいかもしれません。
 
灰色に塗られた部分に注目してください。
小さい順で並んだとき55kg より軽い人たちが灰色の部分にいます。
正規分布の場合、灰色の面積はどのくらいの大きさか計算することができます。
今回の例では、山全体の面積を100%としたとき、
灰色の部分の面積は15.9%になります。
小さい順に並んだとき前から15.9%のところに55kgの人がいる、ということです。
 
この結果から、
15.9パーセンタイル値は55kg 
となります。
 
15.9という数自体にそれほど意味はありません。
 灰色部分の面積を数学的に計算すると全体の15.9%になった、
というだけです。
 灰色部分の面積の計算方法は覚える必要はありません。
 
ここで重要な点は、
正規分布の場合、パーセンタイル値を求めることができる
ということです。
ただし、平均と標準偏差の値が分かっていないと
パーセンタイル値を求めることはできません。
 
パーセンタイル値が幾つになるのかは、
次の表のようにまとめられます。
 

〇%

〇パーセンタイル値

0.1%

平均 ー3×標準偏差

2.3%

平均 ー2×標準偏差

15.9%

平均 ー1×標準偏差

50.0%

平均

84.1%

平均 +1×標準偏差

97.7%

平均 +2×標準偏差

99.9%

平均 +3×標準偏差

 注) この表は正規分布するときのみ正しいです。

 
表中の細かい数字の意味は気にしなくてよいです。
 
この表の使い方を覚えたほうが良いです。
 
 
この表の使い方を具体例を使って説明したいと思います。
 
 
「身長は正規分布する」と統計の世界で扱われることが多いので、
身長を例に説明します。
 
例えば、
2015年度の女児の身長の平均値と標準偏差は下表のとおりです。
f:id:kumonoshu:20180705121350j:plain
 
 
例えば、女子、幼稚園(5歳)の場合、
平均は 109.4 cm
標準偏差は 4.66 cm
ですので
 
109.4 - 3×4.66 = 95.42 cm
より身長が低い人は全体の 0.1%
 
109.4 - 2×4.66 = 100.08 cm
より身長が低い人は全体の 2.3%
 
109.4 - 1×4.66 = 104.74 cm
より身長が低い人は全体の 15.9%
 
109.4 cm
より身長が低い人は全体の 50.0%
 
109.4 + 1×4.66 = 114.06 cm
より身長が低い人は全体の 84.1%
 
109.4 + 2×4.66 = 118.72 cm
より身長が低い人は全体の 97.7%
 
109.4 + 3×4.66 = 123.38 cm
より身長が低い人は全体の 99.9%
 
と判断すると良いです。
表にまとめるとこうなります。
 

〇%

身長

0.1%

95.42 cm

2.3%

100.08 cm

15.9%

104.74 cm

50.0%

109.4 cm

84.1%

114.06 cm

97.7%

118.72 cm

99.9%

123.38 cm

 
例えば、自分の子が5歳の女児で 115 cmだったとします。
このときは、
 
上の表を見ると114.06 cmよりも低い人が全体の84.1%だから、
100人が小さい順にならんだとき、 
前から84番目が約114 cmってことだよなぁ・・・
ん!?
ってことは、自分の子は115cmだから
84番目よりちょっと後ろにいるってことか~!
 
って感じになります。
 
 
ところで、115 cmの子が前から何番目にいるのかを、
もっと正確に求めることもできます。
その方法に興味がある方は過去記事をご覧ください。
 
過去記事
平均と標準偏差 その3:平均と標準偏差を使ってパーセンタイル値を求める方法
 
今回はここまでにしたいと思います。
 
質問・疑問等がありましたら、お気軽にコメントしてください。