前回お話しましたように、
統計の話に「仮説検定」というものがあります。
以後、仮説を省略して「検定」と呼ぶことにしましょう。
統計における検定とは何かといいますと、
まあ、誤解を恐れずに一言でいえば、
検定とは得られた証拠をもとに、結論を下すことです。
この際に重要な点は、証拠の信憑性です。
確実な証拠があるのならば、信憑性を気にする必要はありません。
完全に調べきり、
十分な証拠があるならば信憑性を気にしなくても良いかもしれません。
検定が必要なのは、
十分な証拠はないけれど、いくつかの証拠があるときです。
例えば、テストの成績。
A君の学力が高いかどうか、
はテストの結果を見れば判断できますよね。
学力の判断のための「証拠」がテストの点です。
例えば、あるテストで良い成績をとったとします。
でも、1回のテストなら偶然かもしれません。
1回のテストでは「確実な証拠」にはなりません。
いままでのA君の成績がいまいちだったとしたら、
今回のテストが良い点であったとしても、
偶然だと思われてしまうかもしれません。
1回のテストで良い点をとっても、
A君の学力が高いと判断されないかもしれないのです。
1回のテストでは信憑性が低いからです。
このように、検定では、証拠の信憑性で、ものごとを判断します。
ところで、信憑性が高ければ良いのですが、
証拠が少なくて信憑性が低い場合もありますよね。
でも、信憑性が低い証拠を使ってものごとを判断した結論って、
何だか、うさん臭いですよね。
検定では、結論のうさん臭さを確率で判断します。
確率とは、
ある出来事がどのくらい起きる可能性があるのかを表すもので、
0~100%の間の値を取ります。
うさん臭さの基準は
「有意水準」
と呼ばれています。
例えば、有意水準5%で判断した結果というものは、
5%位は、まあ、うさん臭いけど、95%信頼してもいいかな~
って扱いになります。
ところで、証拠の信頼性は高い方が良いです。
ですので、A君に複数回テストを受けてもらい、
その結果を平均して判断したほうが良さそうです。
A君が受けた複数のテスト結果を平均した平均点で判断すれば、
より正確に学力を判断できるでしょう。
A君の学力の証拠として「A君の平均点」を使う、
という方法です。
検定では、「平均値」を証拠として使うことが多いです。
その理由は、1回の証拠よりも、より正確な証拠になり得るからです。
今回のまとめ
- 検定とは得られた証拠をもとに、結論を下すこと。
- 結論のうさん臭さは有意水準で表す。
次回は、統計における検定の仮説(帰無仮説と対立仮説といいます)
について説明したいと思います。
疑問・質問等ありましたらお気軽にコメントしてください。