第一種過誤と第二種過誤とは?具体例・図解でわかりやすく説明【統計学】

はじめに
仮説検定には
「第一種・第二種過誤」の意味
- 第一種過誤
- 帰無仮説が実際には真にもかかわらず、(棄却して)偽としてしまう誤り
- 第二種過誤
- 帰無仮説が実際には偽にもかかわらず、(棄却しないで)偽としない誤り
重要な関係性
- 第一種過誤の確率α = 有意水準α
- 第二種過誤の確率β = 1- 検出力
- 第一種過誤と第二種過誤の確率はトレードオフ
「第一種・第二種過誤」とは
第一種過誤と第二種過誤とは何か説明します。
検定で生じる2つの誤り
仮説検定には2つのエラーが存在します。
※過誤:仮説検定で誤った判断を下すこと
判定結果×実際 = 正解2 + 誤り2 パターン
2つの過誤が存在する理由は、判定結果に2パターン、実際の結果が2パターンあるためです。
仮説検定では、
「帰無仮説は偽と言えるか?棄却できるか」に対して…
パターン 判定 実際 発生確率 正解1 YES YES 1-β ※ 誤り1
(第一種過誤)YES NO α 誤り2
(第二種過誤)NO YES β 正解2 NO NO 1-α
※1-β=検出力
1-β は、検出力を意味します。
- 棄却できるはずのものを棄却できる確率
- 偽であるものを偽と言える確率
- 差があることを差があると判定できる確率
第一種過誤とは
第一種過誤とは 帰無仮説が実際には真にもかかわらず、偽と言ってしまう誤り です。
別称: 第一種の過誤、Type I Error
「帰無仮説は偽と言えるか?棄却できるか?」に対して…
- 判定: YES「偽と言える」
- 実際: NO「偽と言えない」
第一種過誤
語呂合わせによる覚え方
第一種過誤:「偽と言う(棄却する)のが積極的だったために生じるエラー」
「あわてんぼうのエラー」= α
第二種過誤とは
第二種過誤とは 帰無仮説が実際には偽にもかかわらず、それを偽と言わない誤り です。
別称: 第二種の過誤、Type II Error
「帰無仮説は偽と言えるか?棄却できるか?」に対して…
- 判定: NO「偽と言えない」
- 実際: YES「偽と言える」
第二種過誤
語呂合わせによる覚え方
第二種過誤:「偽と言う(棄却する)のが消極的だったために生じるエラー」
「ぼんやりもののエラー」= β
具体例1. 薬の効果
1つ目の具体例として、
帰無仮説「薬に効果がはない」
棄却できるとき(YESのとき)=「薬に効果がある」
- 第一種過誤
- 判定:(YES)「薬に効果がある」
- 実際:(NO)「薬に効果がない」
- 第二種過誤
- 判定:(NO)「薬に効果があるとは言えない」※
- 実際:(YES)「薬に効果がある」
※注意
仮説検定では「薬に効果がない」とまでは結論付けられません(詳細後述)。
具体例2. 裁判の判決
2つ目の具体例として、
帰無仮説「被告人は無罪である」
棄却できるとき(YESのとき)=「被告人は有罪である」
- 第一種過誤
- 判定:(YES)「有罪である」
- 実際:(NO)「無罪である(誤判)」
- 第二種過誤
- 判定:(NO)「有罪であるとは言えない」※
- 実際:(YES)「有罪である」
※注意
仮説検定では「無罪である」とまでは結論付けられません。
- 第二種過誤が発生した時点の状態
- 「『無罪』である」とまでは言っていない
- 「『有罪』と断定していない」状態
- 何も言っていない状態
時間的な制約など、必要に迫られて「『無罪』と判断する」ことが多いだけ。
帰無仮説を棄却できなかったときは、制約がなければ追加の検証を行うべき。
確率分布上での位置づけ
以下の問に答えるには、
Question
- 第一種過誤の発生確率はなぜ α なのか?
- 第二種過誤の発生確率はなぜ β なのか?
- αとβは小さくできるのか?
ここで登場するのが 帰無仮説の分布 と 真の分布 です。
帰無仮説の分布と真の分布とは
帰無仮説の分布 と 真の分布 とは、
- 帰無仮説の分布: 帰無仮説が真のときに、標本から得られる検定統計量の分布
- 帰無仮説によって仮定される標本の検定統計量の分布
- 真の分布: 実際の母集団の標本から得られる検定統計量の分布
- 実際に標本を取得したとき に、その標本の検定統計量が従う分布
参考:仮説検定で検証している内容
真の分布と帰無仮説の分布が一致しているか
「帰無仮説を棄却」=「2つの分布は一致していないと判定」
注意
これらの名称はしばしば目にしますが、一般的な専門用語ではありません。
仮説検定のおさらい
帰無仮説の分布 と 真の分布 を主役に置き、
- 手順1. 帰無仮説「母集団パラメータ = 〇である」を設定
- 手順2. 帰無仮説の分布が決定
- 手順3. 真の分布から取得される検定統計量が、棄却域に入るか判定
- (YES) 棄却域に入るとき の意味
- 「帰無仮説は偽と言える」
- 「帰無仮説の分布と真の分布が完全に一致すると言え る 」
- (NO) 棄却域に入らないとき の意味
- 「帰無仮説は偽と言えない」
- 「帰無仮説の分布と真の分布が完全に一致するとは言え ない 」
- (YES) 棄却域に入るとき の意味
帰無仮説の分布と真の分布の位置関係
帰無仮説の分布と真の分布の位置関係には、
検定の結果ではなく、 真実の答えによって分岐 します。
(実際に「帰無仮説が真」であるか、「帰無仮説が偽」であるか)
パターン1. 2つの分布が完全に一致
- このときの意味
- 「帰無仮説は真である」
- 「帰無仮説は偽とは言えない(NO)が真実」
↓
- 誤った判定:「帰無仮説は偽と言える(YES)」
- 誤りが生じるとき:検定統計量が棄却域に入ったとき
- 間違い発生確率:α
第一種過誤の発生確率 = α の理由
帰無仮説が真のときに、間違って棄却してしまう確率 =
棄却域に入る確率 α
であるため。
参考:α = 有意水準
「棄却域に入る確率 α
= 有意水準 α 」
の関係があります。
パターン2. 2つの分布は一致しない
- このときの意味
- 「帰無仮説が偽である」
- 「帰無仮説は偽と言える (YES) が真実」
↓
- 誤った判定:「帰無仮説は偽と言えない(NO)」
- 誤りが生じるとき:検定統計量が棄却域に入らないとき
- 間違い発生確率:β
第二種過誤の発生確率 = β の理由
帰無仮説が偽のときに、間違って棄却しない確率 =
棄却域に入らない確率 β
であるため。ポイント
判定のために、
実際に取得される検定統計量は、
真の分布 に従う
参考:β = 1-検出力
「棄却域に入らない確率 β
= 1 - 検出力 」
の関係があります。
(検出力 = 1-β)
αとβはトレードオフ
過誤の発生確率である αとβ は、同時に小さくできません。
αは棄却域に 入る 確率、
棄却域を動かしたときの挙動
- 棄却域を狭くする
α:減少、β:増加- 棄却域を広くする
α:増加、β:減少
他方を増加させず、
対策:サンプル数を増やす
- 分布の裾が狭くなる
α:固定※、β:減少
※棄却域の設定で、αを固定した場合
まとめ
第一種過誤、第二種過誤の
α、βの関係性について理解するため、
「第一種・第二種過誤」の意味
- 第一種過誤
- 帰無仮説が実際には真にもかかわらず、(棄却して)偽としてしまう誤り
- 第二種過誤
- 帰無仮説が実際には誤っているにもかかわらず、(棄却しないで)偽としない誤り
重要な関係性
- 第一種過誤の確率α = 棄却域に入る確率
- 第二種過誤の確率β = 棄却域に入らない確率
- 第一種過誤と第二種過誤の確率はトレードオフ
Q.「帰無仮説は偽と言える?」 Q.「帰無仮説を棄却できる?」 Q.「薬に効果があると言える?」 Q.「被告人は有罪だと言える?」 | 実際 | ||
---|---|---|---|
YES 帰無仮説は偽 効果あり 有罪 | NO 帰無仮説は真 効果なし 無罪 | ||
判定 | YES 帰無仮説は偽 効果あり 有罪 | ○ 正解 (確率 : 1-β) | × 第一種過誤 (確率 : α) |
NO 帰無仮説は偽 or 真 効果あり or なし 有罪 or 無罪 | × 第二種過誤 (確率 : β) | ○ 正解 (確率 : 1-α) |
の確率:β
& 真の分布
の確率:α