前回、検定とは得られた証拠をもとに結論を下すこと、と説明しました。
統計における「検定」は「仮説検定」といいます。
検定の話に「仮説」が出てくるのはなんで?
って思う人は過去記事を見てください。
仮説。
仮の説。
日常会話で使うとすると、
絶対に正しいとは言えないにしても
「まあ、そうなんじゃないかな?」
って思える説のこと。
こんな感じでしょうか?
まあ、
正しいかも?って思う説ならなんでもいいです。
っていうか、
間違ってるかも?って思う説でもいいです。
それが、真偽不明の説ならば、
どんな説でも「仮説」と呼ぶことにしましょう。
ここからが重要なところです。
分かり辛いかもしれませんが、
統計には常に2つの仮説があるのです。
例えば、
A君がある説を思いついたとしましょう。
それをA君の仮説とします。
仮説ですので真偽は不明ですが、
A君は正しいと思っています。
それに対して、B君が
「A君の仮説は間違っている!」
と思ったとします。
このB君の思いつきも仮説なのです。
B君の仮説は
「A君の仮説は間違っているという仮説」
です。
まとめるとこんな感じです。
2つの仮説がある
-
A君の仮説
-
B君の仮説(A君は間違っているという仮説)
このように、どんな仮説に対しても、
「その仮説は間違っている」
という仮説があるのです。
検定では、このような2つの仮説を扱っています。
それを「帰無仮説」と「対立仮説」と呼びます。
2つの仮説がある
-
対立仮説(帰無仮説は間違っているという仮説)
両方とも「仮説」ですので真偽は不明です。
検定では、証拠をもとに仮説が正しいかどうかを判断するのですが、
仮説が正しいと判断されたとき「仮説を採択する」といい、
間違っていると判断されたとき「仮説を棄却する」といいます。
ここで、検定の仕組みを理解する際に重要なポイント。
同じ仮説でも、「帰無仮説」と「対立仮説」は扱いが違います。
検定の主役は「対立仮説」です。
検定では原則として、帰無仮説を採択するという結論は得られません。
大抵の場合、対立仮説を採択することが目的なのです。
ですので、
正しいと証明したい説を「対立仮説」とする方が望ましいです。
(絶対にそうできるという訳ではありません。これは次回説明します)
というわけで、捨て去りたい方の説を「帰無仮説」にしたほうが良いでしょう。
ここで検定の基本的な考え方をまとめておきます。
今は読み飛ばしても良いです。
(ここから)
検定の流れ
(ここまで)
この検定の仕組みを理解するために、漢字検定を例に説明してみます。
ある人が漢字検定1級に合格したいと思っているとします。
検定のテストの結果、
-
不合格
-
合格
の2通りになります。
テストの結果が良ければ、合格だけど、
ヤマが当たってラッキーだったのかもしれません。
テストの結果が悪いときは、不合格ですけど
本来の能力を発揮できなかったのかもしれません。
そこで、テストの結果は
- 不合格
- 1級の能力なし
- 1級の能力あり(本来の能力を発揮できず不合格になった)
- 合格
- 1級の能力なし(ヤマが当たってラッキーで合格した)
- 1級の能力あり
の4通りと考えても良さそうですね。
でも、実際には、ヤマが当たってラッキーな人でも
合格は合格です。ですので、世間では、
1級の能力があるという扱いになりますよね。
つまり、扱いとしては、
- 不合格
- 1級の能力なし
- 1級の能力あり(本来の能力を発揮できず不合格になった)
- 合格
- 1級の能力なし(ヤマが当たってラッキーで合格した)
- 1級の能力あり
となります。
「1級の能力がある人」と「1級の扱いを受ける人」
とは別であることに注意してください。
「1級の能力がある人」は合格・不合格の両方にいます。
一方、
「1級の扱いを受ける人」は「合格した人」だけです。
上の例を「仮説」という用語を使って説明してみましょう。
仮説を上手に設定するには、
捨て去りたい方の説を帰無仮説、
正しいと証明したい方の説を対立仮説
とすると良いです。そこで
帰無仮説:1級の能力なし
対立仮説:1級の能力あり
としましょう。すると
- 不合格
- 帰無仮説が正しい
- 対立仮説が正しい
- 合格
- 帰無仮説が正しい
- 対立仮説が正しい
という扱いになると書き換えられます。
検定のテストの結果、
不合格ならば、帰無仮説と対立仮説のどちらが正しいのか判断できません。
合格ならば、対立仮説が正しいと判断します。
そういう扱いなのです。
対立仮説が正しいと判断することを、対立仮説を採択する、といいます。
簡潔にまとめると
-
不合格
- どちらともいえない
-
合格
- 対立仮説を採択する(対立仮説が正しいという扱いになる)
となります。
ここで重要なポイント。
「対立仮説が正しい」ということと「対立仮説を採択する」ことは違います。
先ほどの例でいうと、
「対立仮説が正しい」とは「1級の能力がある」
ということです。
一方、
「対立仮説を採択する」とは「1級の扱いをする」
ということです。
ところで、
テストで合格したら「1級扱い」になります。
不合格の人には、特になにもありません。
テストの目的は、合格者に1級のお墨付きを与えることです。
合格者の中に「1級の能力がない人」が多少は含まれるにしても、
なるべく少なくなるようにしたいですよね。
1級のブランド価値を守りたい場合、
1級の能力がない人を落とすことを主目的としたテストをする
ことになるでしょう。
例えば、1級の能力がない人が間違えやすい問題を出題する、ということです。
そうすると、1級の能力がない人を落とすことができます。
つまり、
-
受験生が「1級の能力がない」と想定して、その想定が正しいかどうかをテストで判断する。
ということです。
でも、ちょっと待って。
「正しいかどうか」ということと「間違っているかどうか」とは同じような意味ですよね。
ですので
-
受験生が「1級の能力がない」と想定して、その想定が間違っているかどうかをテストで判断する。
と書き換えることができます。
これを仮説という用語で表してみましょう。今回の例では
帰無仮説:1級の能力なし
でしたので、
-
帰無仮説が正しいと想定して、その想定が間違っているかどうかをテストで判断する
となります。
検定では、原則として、
証拠をもとに「帰無仮説」が間違っているかどうかを判断します。
以上を踏まえて、検定の流れをまとめておきましょう。
〈検定の流れ〉
今回のまとめ
-
役割が違う2つの仮説があり、「帰無仮説」と「対立仮説」という。
- 検定では、原則として、証拠をもとに「帰無仮説」が間違っているかどうかを判断する。
-
検定の結果は、「帰無仮説は棄却できない」か「対立仮説を採択する」のどちらかである、というのが原則。
-
「帰無仮説は棄却できない」とは「どちらともいえない」ということである、というのが原則。
補足:有意水準について
ところで、合格した人(1級扱いの人)は
-
1級の能力なし(ヤマが当たってラッキーだった)
-
1級の能力あり
の2通りありますよね。
もし、1級の能力がないのに合格した人が多くいたら、
検定の信憑性が疑われます。
検定の結果の信憑性は「有意水準」というもので表します。
有意水準は α(アルファ)という記号で書かれることが多いです。
まあ、有意水準とは、1級の能力がないのにラッキーで合格した人の割合だと思ってください。
有意水準5%のときとは、
100人中95人は実力通り不合格になったけど、5人はまぐれで合格した、
って感じだと思えば大体OKでしょう。
このように、検定では、まぐれで合格する人がいることを想定しています。
質問などがありましたら、コメントお願いします。