「帰無仮説(きむかせつ)の棄却」と言う、ちょっと難しいけど理解しとくと考え方が広がるお話し

以前、素数の話題を取り上げた際、素数が無限にあることは既に2000年以上も前にユークリッドによって証明されている、という話をしました。でも、無限ということは数え切れないはずなのにどうやって証明したのでしょうか。

ここで用いられたのが背理法です(「ハイリホー」という名前だけは覚えている人も多いでしょう)。
まず、証明したい「素数は無限にある」の逆に「素数の数は有限である」と仮定し、そうすると矛盾が生じる(本稿の内容とはあまり関係がないので詳しい説明は割愛します)ので「素数の数は有限である」は間違い、すなわち「素数の数は有限ではない(=無限)」と証明された、となるわけです。

論理の厳密さが求められる科学の世界では、時にこうした少しひねくれた回りくどい思考法が必要となります。

統計学でも、仮説検定の際に「帰無仮説(きむかせつ)の棄却」という背理法と同様の考え方をします。

例えば、あなたの会社の顧客満足度をライバル会社と比較する調査を実施するとしましょう。限られた人数によるサンプル調査の場合、データに偏りがある可能性は否定しきれません。従って、ある調査であなたの会社の顧客満足度のスコアがライバル会社より高かったとしても、その差がたまたま生じた誤差の範囲なのか、それとも本当に差があるとみなしてよいのかどうかは、統計学上は確率的にしか判断できないのです。

仮説検定では、「自社の顧客満足度はライバル会社より高い」と言いたいとき、逆に「両社のスコアに差はない」と仮定します。この仮定が帰無仮説で、否定したい(=無に帰したい=棄却したい)仮説ということです。そして、「両社のスコアに差がない」状況下で、たまたまある調査において自社の顧客満足度が○%、ライバル会社のスコアが△%、という差が出ることは統計学的に“非常に低い確率”でしか起こらないとしたら、「両社のスコアに差はない」という仮説は間違っている可能性が高いと考えられ、ようやく「自社の顧客満足度はライバル会社より高い」と判断されます。

この時、判断の基準となる“非常に低い確率”は「有意水準」あるいは「危険率」と呼ばれます。「有意水準」「危険率」は小さければ小さいほど厳密になりますが、一般的には5%が用いられることが多いようです。

ただし、いくら確率が低くても絶対に起こらないとは限らないので、仮説検定では以下の2種類の誤りが生じるリスクが考えられています。

<第1種の誤り>
棄却できない帰無仮説を棄却してしまう誤り。
上記の例では、本当は「両社のスコアに差がない」のに「自社の顧客満足度はライバル会社より高い」と判断してしまう場合です。

<第2種の誤り>
棄却すべき帰無仮説を棄却しない誤り。
本当は「自社の顧客満足度はライバル会社より高い」のに「両社のスコアに差がない」と結論してしまうケースが当てはまります。

この2種類の誤りは社会生活におけるリスク判断にも応用できる考え方だと思います。
わかりやすい例だと、犯罪捜査や刑事裁判において

・無罪の人を有罪としてしまう
・有罪の人を無罪としてしまう

あるいは、健康診断で

・健康な人を病気と判断して精密検査をする
・病気の人を健康と判断してしまう

どちらが第1種の誤りでどちらが第2種の誤りに相当するかという定義上の問題はさておき、状況によってどちらの誤りの方がよりリスクが深刻かは異なってくる、ということはお分かりいただけるかと思います。
アンケート調査で

・調査しなくていい人に質問してしまう
・調査すべき人に質問しない

では、明らかに「調査すべき人に質問しない」方が問題でしょう。
ミスが不可避であるなら、できるだけダメージが軽微で済むようなリスク・コントロールを心がけておくことが大切ですね。