3-1.ベイズの定理

この記事を読むのにかかる時間:136

ベイズの定理

確率の定義

1 ラプラスの定義:同様に確からしい根元事象を想定して計算
2 頻度に基づく定義(頻度論):大数の法則
3 主観に基づく定義(ベイズ統計学):主観確率

ベイズの定理

・時間をさかのぼって考える(熱が出たから風邪ではないか?)
・ベイズの定理で求めているのは、条件付き確率である。

ベイズの定理 応用例

・迷惑メールの判別
・機械学習
・病気
など

ベイズの定理(公式)

ベン図

Aの起こる事象を円Aで表すと、Aが起こる条件の下でBの起こる確率は、円Aと円Bの重なる箇所となる。

※ベン図 A∩B≠0 のとき

Aの起こる条件の下でBの起こる確率は、次の式で求められる。

$$P(B|A)=\frac{P(A \cap B)}{P(A)}・・・① ※P(A) ≠ 0$$

同様に、Bの起こる条件の下でAの起こる確率は、次の式となる。

$$P(A|B)=\frac{P(A \cap B)}{P(B)}・・・②  ※P(A) ≠ 0$$
これを乗法定理という。

この式を変形すると、

$$P(A \cap B)=P(B)P(A|B)  ※P(A) ≠ 0$$

となり、これを①の式に代入すると、

$$P(B|A) = \frac{P(B)P(A|B)}{P(A)}・・・③$$

となる。

分母のP(A)は、
$$P(A \cap B_1)+P(A \cap B_2)+・・・+P(A \cap B_k)$$
と考えることができる。
この式を乗法定理を使って表すと、
$$P(B_1)P(A|B_1)+P(B_2)P(A|B_2)+・・・+P(B_i)P(A|B_k)$$
となり、これを③の式に代入してまとめると、
$$P(B_i|A) = \frac{P(B_i)P(A|B_i)}{ {\displaystyle \sum_{j=1}^{n}} P(B_j)P(A|B_j)}$$
が導き出される。これをベイズの定理という。
なお、
P(Bi):事前確率(prior probability)
P(Bi|A):事後確率(posterior probability)
とよぶ。

ベイズの定理 具体例

メールに含まれる文字情報で、これまでの情報から80%が正常のメール、20%が迷惑メールであることが分かっていた。今回の調査では、ある文字が使われていた場合、正常のメールである確率は20%だが、迷惑メールである確率は80%となっていた。この文字を含んでいるメールが迷惑メールである確率はどのくらいか。

・ある文字が含まれている確率は、
 0.8×0.2+0.2×0.8=0.32
・そのうち、迷惑メールである確率は80%なので、
 0.2×0.8/0.32=0.5

ベイズの定理に関する参考サイト

  1. 名古屋市立大学大学院医学研究科・医学部
  2. 中央大学
  3. なるほど統計学園高等部

動画で学べる「ベイズの定理」

2015年度「統計入門」3年生再履修クラス第5回(1) ベイズの定理

あわせて読みたい

コメントを残す

メールアドレスが公開されることはありません。