2.5. 贝叶斯公式#
Theorem 2.5 (贝叶斯公式)
设 \(B_{1},B_{2},\cdots,B_{n}\) 为样本空间 \(\Omega\) 的一个分割,即 \(B_{1},B_{2},\cdots,B_{n}\) 互不相容,且 \(\cup_{i=1}^{n} B_{i}=\Omega\) .如果 \(P(A)>0,P(B_{i})>0,i=1,2,\cdots,n\) ,则:
Proof
由条件概率的定义可知:
在上式中,分子上应用了乘法公式(Theorem 2.2),分母上应用了全概率公式(Theorem 2.4)。因此,定理得证。
Example 2.6 (肝癌首测)
某地区居民的肝癌发病率为 \(0.0004\) ,现用甲胎蛋白法进行普查。医学研究表明,化验结果是可能存在错误的。已知患有肝癌的人其化验结果 \(99\%\) 呈阳性,而没患肝癌的人其化验结果 \(99.9\%\) 呈阴性。现某人的检查结果呈阳性,问他真的患肝癌的概率是多少?
Solution
记 \(B\) 为事件“被检查者患有肝癌”, \(A\) 为事件“检查结果呈阳性”。根据题目可知:
我们关心的问题是求 \(P(B|A)\) 。由贝叶斯公式得
这表明了,在检查结果呈阳性的人中,真患肝癌的人约为 \(28.37\%\) 。
Remark 2.4
首次检验结果呈阳性出现高误报率的原因是:肝癌的发病率很低。在 \(10000\) 个人中约有 \(4\) 人患肝癌,而约有 \(9996\) 人不患肝癌。对 \(10000\) 个人用甲胎蛋白法进行检查,按其错检的概率可知, \(99996\) 个不患肝癌的人约有 \(9996\times 0.001 = 9.996\) 个呈阳性。另外 \(4\) 个真患肝癌者的检查报告中约为 \(4\times 0.99 = 3.96\) 个呈阳性。从 \(13.956\) 个呈阳性者中,真患肝癌的 \(3.96\) 人约占 \(28.37\%\) 。
Example 2.7 (肝癌复测)
对首次检查呈阳性的人群再进行复查。此时 \(P(B)=0.2837\) ,再次使用贝叶斯公式可得:
Example 2.8 (“狼来了”)
设事件 \(A\) 为“小孩说谎”,事件 \(B\) 为“小孩可信”。
不妨设村民过去对这个小孩的印象为:
第一次说谎后,村民对他的信任程度有所改变。我们假设可信的孩子说谎的概率为 \(P(A|B)=0.1\) ,不可信的孩子说谎的概率为 \(P(A|\overline{B})=0.4\) .
利用贝叶斯公式,计算小孩第一次说谎后,其可信的概率为:
在一次说谎后,村民对小孩的信任程度由 \(0.8\) 变为 \(0.444\) ,即:
第二次说谎后,村民对他的信任程度为:
这表明:村民经过两次上当后,对这个小孩的信任程度已经从 \(0.8\) 下降到了 \(0.138\) ,如此低的信任度,村民听到第三次呼叫时怎么会在上山打狼呢?