仮説検定とは?手順もわかりやすく図解【統計学】

はじめに
仮説検定は、統計学の中でも重要なツールの1つです。
仮説検定とは何か
仮説検定(「統計的仮説検定」「検定」と呼ばれることも)とは 「仮説が正しいのかを、統計学的に検証すること」 です。
たとえば、
例題「100g入りのフライドポテト」という商品があったとします。
実際にこの商品を5品買って質量を測ってみると、
平均95gでした。公表値100gとの間に差がありますが、
この結果は公表値通りと言えるのでしょうか。
それとも公表値通りではないと
結論付けた方が良いのでしょうか。
仮説検定を用いると、
仮説検定の手順
仮説検定では、
この流れは、
-
手順1. 対立仮説と帰無仮説を立てる。
確認したい仮説(対立仮説)と、
それを否定する仮説(帰無仮説)を設定します。帰無仮説では母集団が仮定されます。 -
手順2. 使用する検定統計量を決定する。
帰無仮説の真偽を判定するために用いる尺度(検定統計量)を決めます。これにより統計的に、検定統計量の分布までは自動的に決定します。 検定統計量の分布は、 母集団から作られる無限個の標本を仮定して形成されています。 -
手順3. 棄却域を決定する。
帰無仮説の判定基準となる検定統計量の範囲(棄却域)を決めます。母集団と1つの標本から検定統計量を得た場合に、 値がほぼ入らないはずの範囲が設定されます。 -
手順4. 帰無仮説の真偽を判定する。
帰無仮説を基に検定統計量を算出し、棄却域に入るか評価を行います。 ここで初めて実際のデータ(標本)を用いて評価します。
それぞれの手順について解説していきます。
手順1. 対立仮説と帰無仮説を立てる。
仮説検定では、2つの仮説を立てることから始まります。
- 対立仮説 :確認したい仮説
- 帰無仮説 :対立仮説を否定する仮説
帰無仮説が否定されることを示すことで、
以下で、それぞれの仮説について述べ、手順の具体例を示します。
対立仮説と帰無仮説とは
仮説検定の大まかな流れは、
対立仮説は、
帰無仮説は、
帰無仮説を基に、母集団を仮定して検証を進めていき、
仮説の具体例
手順1で立てる仮説として、
- 対立仮説 : 「フライドポテトの質量は100gではない」
- 帰無仮説 : 「フライドポテトの質量は100gである」
これは、次の例題がある場合に設定されます。
例題あるバーガーショップで
以下のようなフライドポテトが販売されています。
- 1品当たりの質量:100g(公表値)
このフライドポテトを5品買って、
質量を実測すると以下の結果でした。
- 平均:95g
- 不偏分散:8g2
このショップで販売しているフライドポテト1品の
対立仮説には、本来検証したい内容を設定します。
- 対立仮説 : 「フライドポテトの質量は100gではない」
帰無仮説には、対立仮説の否定を設定します。
- 帰無仮説 : 「フライドポテトの質量は100gである」
仮説検定では、帰無仮説が正しいと仮定して進めていきます。
手順2. 使用する検定統計量を決定する。
手順1で帰無仮説を立てたら、
以下で、検定統計量の考え方について述べ、
検定統計量とは
検定統計量は
たとえば、
検定統計量は、
検定統計量の決め方
どの検定統計量を使用するのかは、
- 選択する検定統計量は、
仮定や手元の情報から算出できるか。 - 検定統計量によっては、
使用できる前提条件が存在するが、 それを満たしているのか。
また注意点として、
使用する検定統計量を決める具体例
母平均と標本平均、不偏分散
帰無仮説 : 「フライドポテトの質量は100gである」
母平均は、帰無仮説 から設定できます。
まず母平均について考えてみます。
次に、標本平均、不偏分散について考えてみます。
上記のように、
- : 検定統計量
- : 標本平均
- : 母平均
- : 不偏分散
- : サンプルサイズ
値には、使用条件があります。
手順3. 棄却域を決定する。
使用する検定統計量を決めた(手順2)次は、
棄却域を決めるには、
- 設定項目1: 有意水準
- 設定項目2: 検定方式(両側検定か片側検定か)
以下では、
棄却域を決めるために2つの設定が必要
帰無仮説から算出される検定統計量を
検定統計量は、従う確率分布が統計学的にわかっています。
しかし実際は、
「ぼほすべての検定統計量が採択域に入る」
棄却域を決めるために
- 「ほぼすべて」の外側の確率を何%とするか:有意水準
- 確率分布を片側から区切るか、両側から区切るか:検定方式
設定項目1: 有意水準
棄却域を決定するために、
有意水準 の意味は、
帰無仮説が正しい場合、
帰無仮説が正しいときの、
-
採択域
- 発生確率(確率分布上での面積) : 1-
- ほぼすべての検定統計量が入る範囲
- 偶然で生じると言える範囲
-
棄却域
- 発生確率(確率分布上での面積) :
- 無視できる程度の確率でしか生じない、
きわめて珍しいことが起きたときに入る範囲 - 偶然でもなかなか生じない範囲
→ 偶然ではなく、意味のある差異(有意差)があると判断される範囲
設定項目2: 検定方式(両側検定か片側検定か)
棄却域を決定するため、
棄却域を設定する、
検定方式には2種類あり、
- 両側検定:
- 棄却域の位置:確率分布の上下(図上では左右)の両側2か所
- 棄却域の面積:(1か所あたり)
- 片側検定(下側検定、上側検定):
- 棄却域の位置:確率分布の下側または上側(図上では、右側または左側)の1か所
- 棄却域の面積:(1か所あたり)
片側検定はさらに2種類に分かれ、
- 下側検定:
- 棄却域の位置:下側(図上では右側)
- 上側検定:
- 棄却域の位置:上側(図上では左側)
棄却域を決定する
設定項目2つが決まると、
分布表には、
- 自由度
- 有意水準
- 検定方式
自由度は、
表の中で使用する有意水準 と検定方式には、
- 設定項目1の有意水準 の値
- 設定項目2の検定方式(片側検定か両側検定か)
を設定します。 は、「危険率」と表記されている場合もあります。
分布表から読み取った検定統計量が、
- 両側検定の場合
- 下限:-(分布表の値)
- 上限:分布表の値
- 片側検定(下側検定)の場合
- 下限:なし
- 上限:分布表の値
- 片側検定(上側検定)の場合
- 下限:-(分布表の値)
- 上限:なし
棄却域の決定の具体例
手順1~2の具体例の設定を使い、
手順1~2の設定
- 帰無仮説 :
「フライドポテトの質量は100gである」 - 検定統計量 : 値
採択域を決めるため、
- 設定項目1: 有意水準 = 0.05 (5%)
- 設定項目2: 検定方式 = 両側
データの数(サンプルサイズ)が5個の場合、
これらの条件使って 分布表を確認すると、
両側検定の場合の 分布表
のとき | のとき | |
---|---|---|
1 | 12.706 | 63.657 |
2 | 4.303 | 9.925 |
3 | 3.182 | 5.841 |
4 | 2.776 | 4.604 |
5 | 2.571 | 4.032 |
手順4. 帰無仮説の真偽を判定する。
手順3で、帰無仮説がほぼ否定される統計量の範囲(棄却域)を決めました。
以下では、
帰無仮説を棄却し、対立仮説を採択する
手順1~3までに決まった内容を基に、
- i. 仮定とデータから検定統計量を計算する
- ii. 採択域と比較する
- iii. 結論を出す
i. 仮定とデータから検定統計量を計算する
実際の測定データ(1標本)と、
この検定統計量は、
実際の測定データ(1標本)を
ii. 棄却域と比較する
iの検定統計量の値と棄却域を比較します。
棄却域は、手順3までで決めた検定統計量の範囲です。
iii. 結論を出す
iiの結果を踏まえて、
帰無仮説がほぼ否定されることを「棄却する」と言います。
判定の具体例
手順1~3の具体例の設定を使い、
手順1~3の設定
- 帰無仮説 : 「フライドポテトの質量は100gである」
- 棄却域 :
- 検定統計量 : 値
- 有意水準 : 0.05
- 検定方式 : 両側検定
- サンプルサイズ : 5
結論までは、
- i. 仮定とデータから 値を計算する
- ii. 棄却域と比較する
- iii. 結論を出す
の順で進めていきます。
i. 仮定とデータから 値を計算する
仮説とデータから得られる数値を
仮説から下記が得られます。
- 母平均 = 100
データについては、
- サンプル平均 = 95
- 不偏分散 = 8
データの取得条件である、
- サンプルサイズ = 5
です。 もし、使用するデータのサンプルサイズを、 棄却域の決定時(手順3)のサンプルサイズから変更する場合には、 再度、棄却域の決定をやり直す必要があります。
上記の値を使って 値を算出すると次の通りになります。
- : 検定統計量
- : 標本平均 = 95
- : 母平均 = 100
- : 不偏分散 = 8
- : サンプルサイズ = 5
ii. 棄却域と比較する
棄却域は
-
です(手順3より)。 仮説から導いた値は -
です(手順4 iより)。
この2つを比較すると、
iii. 結論を出す
帰無仮説が成り立つ前提で、
この結果から、
- 帰無仮説 : 「フライドポテトの質量は100gである」
は、棄却されます。 そして、 - 対立仮説 : 「フライドポテトの質量は100gではない」
が採択されます。
最終的に、
まとめ
仮説検定では、確認したい仮説を否定する仮説を立て、
大まかに次の手順で進めます。
手順1. 仮説を立てる。
対立仮説と帰無仮説を立てる。
手順2. 使用する検定統計量を決定する。
帰無仮説が成り立つかの評価に用いる検定統計量を決める。
手順3. 判定基準となる検定統計量の範囲を決定する。
帰無仮説が成り立つかの判定基準となる棄却域を、統計学的に決定する。
手順4. 実際のデータから検証を行う。
帰無仮説と実験データから検定統計量を計算し、棄却域にはいるか検証し結論を出す。