2025/2/24

第一種過誤と第二種過誤とは?具体例・図解でわかりやすく説明【統計学】

Thumbnail for 第一種過誤と第二種過誤とは?具体例・図解でわかりやすく説明【統計学】

はじめに

仮説検定には 第一種過誤と第二種過誤という 2つのエラーが存在します。 本記事では、 この2つのエラーとは何か、 生じる確率を下げられるのか、 について取り扱います。

「第一種・第二種過誤」の意味

  • 第一種過誤
    • 帰無仮説が実際には真にもかかわらず、(棄却して)偽としてしまう誤り
  • 第二種過誤
    • 帰無仮説が実際には偽にもかかわらず、(棄却しないで)偽としない誤り

重要な関係性

  • 第一種過誤の確率α = 有意水準α
  • 第二種過誤の確率β = 1- 検出力
  • 第一種過誤と第二種過誤の確率はトレードオフ

「第一種・第二種過誤」とは

第一種過誤と第二種過誤とは何か説明します。 具体例も紹介します。

検定で生じる2つの誤り

仮説検定には2つのエラーが存在します。 このエラーを 過誤 と呼び、 第一種過誤と第二種過誤で区別されます。
※過誤:仮説検定で誤った判断を下すこと

判定結果×実際 = 正解2 + 誤り2 パターン

2つの過誤が存在する理由は、判定結果に2パターン、実際の結果が2パターンあるためです。 これにより、正解が2パターン、誤り2パターンが存在することになります。 この2パターンの誤りのそれぞれが、 第一種過誤と第二種過誤に相当します。

仮説検定では、 「帰無仮説は偽と言えるか?棄却できるか?」 という問に対して、 YESかNOの2択で判定することになります。 判定結果2択 × 実際の答え の掛け合わせで、 以下の4つのパターンができます。

「帰無仮説は偽と言えるか?棄却できるか」に対して…

パターン判定実際発生確率
正解1YESYES1-β ※
誤り1
(第一種過誤)
YESNOα
誤り2
(第二種過誤)
NOYESβ
正解2NONO1-α

※1-β=検出力

1-β は、検出力を意味します。

  • 棄却できるはずのものを棄却できる確率
  • 偽であるものを偽と言える確率
  • 差があることを差があると判定できる確率

第一種過誤とは

第一種過誤とは 帰無仮説が実際には真にもかかわらず、偽と言ってしまう誤り です。 別の言い方をすると、実際は棄却できないのに、棄却してしまうこと(擬陽性)です。
別称: 第一種の過誤、Type I Error

「帰無仮説は偽と言えるか?棄却できるか?」に対して…

  • 判定: YES「偽と言える」
  • 実際: NO「偽と言えない」
    第一種過誤

語呂合わせによる覚え方

第一種過誤:「偽と言う(棄却する)のが積極的だったために生じるエラー」

「あわてんぼうのエラー」= α

第二種過誤とは

第二種過誤とは 帰無仮説が実際には偽にもかかわらず、それを偽と言わない誤り です。 別の言い方をすると、実際は棄却できるのに、棄却しないこと(偽陰性)です。
別称: 第二種の過誤、Type II Error

「帰無仮説は偽と言えるか?棄却できるか?」に対して…

  • 判定: NO「偽と言えない」
  • 実際: YES「偽と言える」
    第二種過誤

語呂合わせによる覚え方

第二種過誤:「偽と言う(棄却する)のが消極的だったために生じるエラー」

「ぼんやりもののエラー」= β

具体例1. 薬の効果

1つ目の具体例として、 薬の効果についての仮説検定と、 そのときの過誤を紹介します。

帰無仮説「薬に効果がはない」

棄却できるとき(YESのとき)=「薬に効果がある」

  • 第一種過誤
    • 判定:(YES)「薬に効果がある」
    • 実際:(NO)「薬に効果がない」
  • 第二種過誤
    • 判定:(NO)「薬に効果があるとは言えない」※
    • 実際:(YES)「薬に効果がある」

※注意

仮説検定では「薬に効果がない」とまでは結論付けられません(詳細後述)。

具体例2.  裁判の判決

2つ目の具体例として、 裁判の判決についての仮説検定と、 そのときの過誤を紹介します。

帰無仮説「被告人は無罪である」

棄却できるとき(YESのとき)=「被告人は有罪である」

  • 第一種過誤
    • 判定:(YES)「有罪である」
    • 実際:(NO)「無罪である(誤判)」
  • 第二種過誤
    • 判定:(NO)「有罪であるとは言えない」※
    • 実際:(YES)「有罪である」

※注意

仮説検定では「無罪である」とまでは結論付けられません。

  • 第二種過誤が発生した時点の状態
    • 「『無罪』である」とまでは言っていない
    • 「『有罪』と断定していない」状態
    • 何も言っていない状態

時間的な制約など、必要に迫られて「『無罪』と判断する」ことが多いだけ。
帰無仮説を棄却できなかったときは、制約がなければ追加の検証を行うべき。

確率分布上での位置づけ

以下の問に答えるには、 2つの過誤と確率分布の関係を考える必要があります。

Question
  • 第一種過誤の発生確率はなぜ α なのか?
  • 第二種過誤の発生確率はなぜ β なのか?
  • αとβは小さくできるのか?

ここで登場するのが 帰無仮説の分布 真の分布 です。 以降で、これらの分布の説明、 仮説検定中での関わり、 2つの過誤との関わりを説明します。 最後に、2つの過誤の発生確率を下げられるのか触れます。

帰無仮説の分布と真の分布とは

帰無仮説の分布 真の分布 とは、 仮説検定で登場する、2つの検定統計量の分布です。

  • 帰無仮説の分布: 帰無仮説が真のときに、標本から得られる検定統計量の分布
    • 帰無仮説によって仮定される標本の検定統計量の分布
  • 真の分布: 実際の母集団の標本から得られる検定統計量の分布
    • 実際に標本を取得したとき に、その標本の検定統計量が従う分布

参考:仮説検定で検証している内容

真の分布と帰無仮説の分布が一致しているか

「帰無仮説を棄却」=「2つの分布は一致していないと判定」

注意

これらの名称はしばしば目にしますが、一般的な専門用語ではありません。

仮説検定のおさらい

帰無仮説の分布 真の分布 を主役に置き、 仮説検定の流れを振り返ってみます。

  • 手順1. 帰無仮説「母集団パラメータ = 〇である」を設定
  • 手順2. 帰無仮説の分布が決定
  • 手順3. 真の分布から取得される検定統計量が、棄却域に入るか判定
    • (YES) 棄却域に入るとき の意味
      • 「帰無仮説は偽と言える」
      • 「帰無仮説の分布と真の分布が完全に一致すると言え
    • (NO) 棄却域に入らないとき の意味
      • 「帰無仮説は偽と言えない」
      • 「帰無仮説の分布と真の分布が完全に一致するとは言え ない

帰無仮説の分布と真の分布の位置関係

帰無仮説の分布と真の分布の位置関係には、 2つの分布が完全に一致するパターンと 一致しないパターンの2種類が 存在することになります。

検定の結果ではなく、 真実の答えによって分岐 します。
(実際に「帰無仮説が真」であるか、「帰無仮説が偽」であるか)

パターン1. 2つの分布が完全に一致

  • このときの意味
    • 「帰無仮説は真である」
    • 「帰無仮説は偽とは言えない(NO)が真実」

    ↓

  • 誤った判定:「帰無仮説は偽と言える(YES)」
    • 誤りが生じるとき:検定統計量が棄却域に入ったとき
    • 間違い発生確率:α

第一種過誤の発生確率 = α の理由

帰無仮説が真のときに、間違って棄却してしまう確率 =
棄却域に入る確率 α
であるため。

参考:α = 有意水準

「棄却域に入る確率 α
= 有意水準 α 」
の関係があります。

パターン2. 2つの分布は一致しない

  • このときの意味
    • 「帰無仮説が偽である」
    • 「帰無仮説は偽と言える (YES) が真実」

    ↓

  • 誤った判定:「帰無仮説は偽と言えない(NO)」
    • 誤りが生じるとき:検定統計量が棄却域に入らないとき
    • 間違い発生確率:β

第二種過誤の発生確率 = β の理由

帰無仮説が偽のときに、間違って棄却しない確率 =
棄却域に入らない確率 β
であるため。

ポイント

判定のために、
実際に取得される検定統計量は、
真の分布 に従う

参考:β = 1-検出力

「棄却域に入らない確率 β
= 1 - 検出力 」
の関係があります。
(検出力 = 1-β)

αとβはトレードオフ

過誤の発生確率である αとβ は、同時に小さくできません。
αは棄却域に 入る 確率、 βは棄却域に 入らない 確率 であるためです。

棄却域を動かしたときの挙動

  • 棄却域を狭くする
    α:減少、β:増加
  • 棄却域を広くする
    α:増加、β:減少

他方を増加させず、 αまたはβの値を小さくする方法には、 サンプル数(標本数)を増やす方法があります。

対策:サンプル数を増やす

  • 分布の裾が狭くなる
    α:固定※、β:減少
    ※棄却域の設定で、αを固定した場合

まとめ

第一種過誤、第二種過誤の 2つのエラーについて解説しました。

α、βの関係性について理解するため、 確率分布についても取り扱いました。

「第一種・第二種過誤」の意味

  • 第一種過誤
    • 帰無仮説が実際には真にもかかわらず、(棄却して)偽としてしまう誤り
  • 第二種過誤
    • 帰無仮説が実際には誤っているにもかかわらず、(棄却しないで)偽としない誤り

重要な関係性

  • 第一種過誤の確率α = 棄却域に入る確率
  • 第二種過誤の確率β = 棄却域に入らない確率
  • 第一種過誤と第二種過誤の確率はトレードオフ

Q.「帰無仮説は偽と言える?」

Q.「帰無仮説を棄却できる?」

Q.「薬に効果があると言える?」

Q.「被告人は有罪だと言える?」

実際

YES

帰無仮説は偽

効果あり

有罪

NO

帰無仮説は真

効果なし

無罪

判定

YES

帰無仮説は偽

効果あり

有罪

○ 正解

(確率 : 1-β)

× 第一種過誤

(確率 : α)

NO

帰無仮説は偽 or 真

効果あり or なし

有罪 or 無罪

× 第二種過誤

(確率 : β)

○ 正解

(確率 : 1-α)

帰無仮説が偽 のとき
採択域棄却域-2024tt00.10.20.30.4P ( t )P ( t )
真の分布
帰無仮説の分布
帰無仮説が真 のとき
採択域棄却域-2024tt00.10.20.30.4P ( t )P ( t )
帰無仮説の分布
& 真の分布
第一種過誤
の確率:α
採択域棄却域-2024tt00.10.20.30.4P ( t )P ( t )
α 固定
採択域棄却域-2024tt00.10.20.30.4P ( t )P ( t )
β 減少
サンプル数:多