はじめに
条件つき確率$P(B \, | \, A)$とは、2つの事象$A$と$B$があるとき、事象$A$が起こったという条件のもとで、$B$が起こる確率
$P(B \, | \, A) = \dfrac{P(A \cap B)}{P(A)}$ ただし、$P(A) > 0$
であるとされます。
このとき、
「分かったような、分からないような」
「どうもイメージがつかない」
といった印象を持つ方も多いのではないでしょう。
ただ、図で考えると、分かりやすい部分があるので、図と数値例で、条件つき確率について、説明したいと思います。
条件つき確率
設定
数値例として、男性と女性がおり、自動車免許をもっているかどうかというものを考えましょう。
男性は10人おり、免許を持っている人は7人、持っていない人は3人
女性は10人おり、免許を持っている人は6人、持っていない人は4人
同時確率
条件つき確率の話に入る前に、同時確率について、説明します。
同時確率とは、
$P(A \cap B)$
と表され、2つの事象が同時に起こったときの確率です。言い換えると、「A かつ B」のときの確率が、同時確率です。
数値例でいえば、次の4つのパターンがあります。
男性・免許あり : 7人
男性・免許なし : 3人
女性・免許あり : 6人
女性・免許なし : 4人
縦に免許の有無、横に性別として、図で表すと、次のようになります。
全体で20人いるため、それぞれのパターンの確率は、次のようになります。
男性・免許あり : 7人 ÷ 20人 = 0.35
男性・免許なし : 3人 ÷ 20人 = 0.15
女性・免許あり : 6人 ÷ 20人 = 0.3
女性・免許なし : 4人 ÷ 20人 = 0.2
条件つき確率
まずは、男性であるという条件のもと、自動車免許をもっている確率という条件つき確率を考えましょう。
これを図で表すと、次のようになります。
条件つき確率は、男性である確率(太枠)の中で、男性かつ免許がある確率(オレンジ部分)がどれだけなのかを計算します。
具体的には、男性かつ免許があるという同時確率に対して、男性である確率を割れば、いいことになります。
男性である確率は、0.5(=10人÷20人)なので、
条件つき確率 = 男性・免許ありという同時確率 ÷ 男性である確率 = 0.35 ÷ 0.5 = 0.7
となります。これは、最初の条件つき確率の公式と同じ形になっています。
(なお、女性を無視すれば、免許あり7人÷男性10人の確率と同じになっています)
同様に、免許ありという条件のもと、男性である確率を求めてみましょう。
これを図で表すと、次のようになります。
免許ありの確率は、0.65(=13人÷20人)なので、
条件つき確率 = 男性・免許ありという同時確率 ÷ 免許ありの確率 = 0.35 ÷ 0.65 = 0.54
となります。先ほどの男性という条件のもとでの条件つき確率と比べ、分母の数字が変わっています。
(なお、免許なしを無視すれば、男性7人÷免許あり13人の確率と同じになっています)
まとめ
図で表すと、条件つき確率のイメージが分かりやすくなったのではないでしょうか。
通常の確率においては、全体を分母に持ってくるのに対して、条件つき確率では、その条件であるものの確率が分母に来ているのが、特徴的であると言えます(上記の図でいえば、太枠部分)。
そして、このあたりのイメージがないため、条件つき確率が分かりにくくなっているような気がしています。
参考
中村隆英『統計入門』
涌井貞美『図解・ベイズ統計「超」入門』