くものしゅの日記

子育て中の ph. D.です。専門は確率統計.情報理論等

検定 その3:帰無仮説と対立仮説(役割が違う2つの仮説)

前回、検定とは得られた証拠をもとに結論を下すこと、と説明しました。
 
統計における「検定」は「仮説検定」といいます。
 
検定の話に「仮説」が出てくるのはなんで?
って思う人は過去記事を見てください。
 
仮説。
 
仮の説。
 
日常会話で使うとすると、
絶対に正しいとは言えないにしても
「まあ、そうなんじゃないかな?」
って思える説のこと。
こんな感じでしょうか?
 
まあ、
正しいかも?って思う説ならなんでもいいです。
っていうか、
間違ってるかも?って思う説でもいいです。
それが、真偽不明の説ならば、
どんな説でも「仮説」と呼ぶことにしましょう。
 
ここからが重要なところです。
分かり辛いかもしれませんが、
統計には常に2つの仮説があるのです。
 
例えば、
 
A君がある説を思いついたとしましょう。
それをA君の仮説とします。
仮説ですので真偽は不明ですが、
A君は正しいと思っています。
 
それに対して、B君が
「A君の仮説は間違っている!」
と思ったとします。
このB君の思いつきも仮説なのです。
B君の仮説は
「A君の仮説は間違っているという仮説」
です。
 
まとめるとこんな感じです。
 
2つの仮説がある
  • A君の仮説
  • B君の仮説(A君は間違っているという仮説)
 
このように、どんな仮説に対しても、
「その仮説は間違っている」
という仮説があるのです。
 
検定では、このような2つの仮説を扱っています。
それを「帰無仮説」と「対立仮説」と呼びます。
 
2つの仮説がある
 
両方とも「仮説」ですので真偽は不明です。
検定では、証拠をもとに仮説が正しいかどうかを判断するのですが、
仮説が正しいと判断されたとき「仮説を採択する」といい、
間違っていると判断されたとき「仮説を棄却する」といいます。
 
ここで、検定の仕組みを理解する際に重要なポイント。
 
同じ仮説でも、「帰無仮説」と「対立仮説」は扱いが違います。
検定の主役は「対立仮説」です。
検定では原則として、帰無仮説を採択するという結論は得られません。
大抵の場合、対立仮説を採択することが目的なのです。
 
ですので、
正しいと証明したい説を「対立仮説」とする方が望ましいです。
(絶対にそうできるという訳ではありません。これは次回説明します)
というわけで、捨て去りたい方の説を「帰無仮説」にしたほうが良いでしょう。
 
ここで検定の基本的な考え方をまとめておきます。
今は読み飛ばしても良いです。
 
(ここから)
検定の流れ
  • はじめは、帰無仮説と対立仮説のどちらが正しいかが分からない。
  • そこで、証拠をもとに「帰無仮説」が間違っているかどうかを判断する。
  • その結果、次のどちらかになる。
(ここまで)
 
この検定の仕組みを理解するために、漢字検定を例に説明してみます。
 
ある人が漢字検定1級に合格したいと思っているとします。
検定のテストの結果、
 
  • 不合格
  • 合格
 
の2通りになります。
 
テストの結果が良ければ、合格だけど、
ヤマが当たってラッキーだったのかもしれません。
テストの結果が悪いときは、不合格ですけど
本来の能力を発揮できなかったのかもしれません。
 
そこで、テストの結果は
 
  • 不合格
    • 1級の能力なし
    • 1級の能力あり(本来の能力を発揮できず不合格になった)
  • 合格
    • 1級の能力なし(ヤマが当たってラッキーで合格した)
    • 1級の能力あり
 
の4通りと考えても良さそうですね。
 
でも、実際には、ヤマが当たってラッキーな人でも
合格は合格です。ですので、世間では、
1級の能力があるという扱いになりますよね。
 
つまり、扱いとしては、
 
  • 不合格
    • 1級の能力なし
    • 1級の能力あり(本来の能力を発揮できず不合格になった)
  • 合格
    • 1級の能力なし(ヤマが当たってラッキーで合格した)
    • 1級の能力あり
 
となります。
 
「1級の能力がある人」と「1級の扱いを受ける人」
とは別であることに注意してください。
「1級の能力がある人」は合格・不合格の両方にいます。
 
一方、
 
「1級の扱いを受ける人」は「合格した人」だけです。
 
上の例を「仮説」という用語を使って説明してみましょう。
 
仮説を上手に設定するには、
捨て去りたい方の説を帰無仮説
正しいと証明したい方の説を対立仮説
とすると良いです。そこで
 
帰無仮説:1級の能力なし
対立仮説:1級の能力あり
 
としましょう。すると
 
  • 不合格
という扱いになると書き換えられます。
 
検定のテストの結果、
不合格ならば、帰無仮説と対立仮説のどちらが正しいのか判断できません。
合格ならば、対立仮説が正しいと判断します。
そういう扱いなのです。
対立仮説が正しいと判断することを、対立仮説を採択する、といいます。
 
簡潔にまとめると
  • 不合格
    • どちらともいえない 
  • 合格
    • 対立仮説を採択する(対立仮説が正しいという扱いになる)
となります。
 
ここで重要なポイント。
 
「対立仮説が正しい」ということと「対立仮説を採択する」ことは違います。
 
先ほどの例でいうと、
「対立仮説が正しい」とは「1級の能力がある」
ということです。
一方、
「対立仮説を採択する」とは「1級の扱いをする」
ということです。
 
 
ところで、
テストで合格したら「1級扱い」になります。
不合格の人には、特になにもありません。
テストの目的は、合格者に1級のお墨付きを与えることです。
合格者の中に「1級の能力がない人」が多少は含まれるにしても、
なるべく少なくなるようにしたいですよね。
 
1級のブランド価値を守りたい場合、
1級の能力がない人を落とすことを主目的としたテストをする
ことになるでしょう。
例えば、1級の能力がない人が間違えやすい問題を出題する、ということです。
そうすると、1級の能力がない人を落とすことができます。
 
つまり、
  • 受験生が「1級の能力がない」と想定して、その想定が正しいかどうかをテストで判断する。
ということです。
でも、ちょっと待って。
「正しいかどうか」ということと「間違っているかどうか」とは同じような意味ですよね。
ですので
  • 受験生が「1級の能力がない」と想定して、その想定が間違っているかどうかをテストで判断する。
と書き換えることができます。
 
これを仮説という用語で表してみましょう。今回の例では
 
帰無仮説:1級の能力なし
 
でしたので、
 
  • 帰無仮説が正しいと想定して、その想定が間違っているかどうかをテストで判断する
 
となります。
 
検定では、原則として、
 
証拠をもとに「帰無仮説」が間違っているかどうかを判断します。
 
以上を踏まえて、検定の流れをまとめておきましょう。
 
 
〈検定の流れ〉
  • はじめは、帰無仮説と対立仮説のどちらが正しいかが分からない。
  • そこで、証拠をもとに「帰無仮説」が間違っているかどうかを判断する。
  • その結果、次のどちらかになる。
 
 
今回のまとめ
  • 役割が違う2つの仮説があり、「帰無仮説」と「対立仮説」という。
  • 検定では、原則として、証拠をもとに「帰無仮説」が間違っているかどうかを判断する。
  • 検定の結果は、「帰無仮説は棄却できない」か「対立仮説を採択する」のどちらかである、というのが原則。
  • 帰無仮説は棄却できない」とは「どちらともいえない」ということである、というのが原則。
 
 
補足:有意水準について
ところで、合格した人(1級扱いの人)は
  • 1級の能力なし(ヤマが当たってラッキーだった)
  • 1級の能力あり
の2通りありますよね。
もし、1級の能力がないのに合格した人が多くいたら、
検定の信憑性が疑われます。
 
検定の結果の信憑性は「有意水準」というもので表します。
 
有意水準は α(アルファ)という記号で書かれることが多いです。
 
まあ、有意水準とは、1級の能力がないのにラッキーで合格した人の割合だと思ってください。
 
有意水準5%のときとは、
100人中95人は実力通り不合格になったけど、5人はまぐれで合格した、
って感じだと思えば大体OKでしょう。
 
このように、検定では、まぐれで合格する人がいることを想定しています。
 
 
 
質問などがありましたら、コメントお願いします。