全概率公式

2.4. 全概率公式#

样本空间的分割: 对样本空间 \(\Omega\) ，如果有 \(n\) 个事件 \(D_{1},D_{2} ,\cdots ,D_{n}\) 满足：

诸 \(D_{i}\) 互不相容： \(\forall i\neq j,D_{i}\cap D_{j}=\emptyset\) ；
\(\cup_{i=1}^{n} D_{i}=\Omega\) ；

则称 \(\{D_{1},D_{2},\cdots,D_{n}\}\) 为样本空间 \(\Omega\) 的一组分割。

Example 2.3

设样本空间为 \(R\) 。设 \(\mu\) 和 \(\sigma>0\) 为两个已知的常数。令：

\(D_{1}=\left \{ \left | x-\mu \right | \leq \sigma \right \}\) ；
\(D_{2}=\left \{ \sigma <\left | x-\mu \right | \leq 2\sigma \right \}\) ；
\(D_{3}=\left \{ 2 \sigma <\left | x-\mu \right | \leq 3\sigma \right \}\) ；
\(D_{4}=\left \{ \left | x-\mu \right | > 3\sigma \right \}\) 。

于是， \(\mathcal{D} =\left \{ D_{1} ,D_{2} ,D_{3} ,D_{4} \right \}\) 是一个分割。

Theorem 2.4 (全概率公式)

设 \(B_{1},B_{2},\cdots,B_{n}\) 为样本空间 \(\Omega\) 的一个分割，即 \(B_{1},B_{2},\cdots,B_{n}\) 互不相容，且 \(\cup_{i=1}^{n} B_{i}=\Omega\) 。如果 \(P(B_{i})>0\) ，则对任一事件 \(A\) ，有：

\[P(A)=\sum_{i=1}^{n} P(B_{i})P(A|B_{i})\]

Example 2.4 (摸彩模型)

设在 \(n\) 张彩票中有一张可中大奖，求第二个人摸出中奖彩票的概率是多少？

Remark 2.3

类似地，可推导出：

\[P(A_{i})=\frac{1}{n} ,i=1,2,\cdots ,n\]

这表明：摸到中奖彩票的机会与先后次序无关。

Example 2.5 (敏感性问题调查)

敏感性问题调查是社会调查之一。常见的敏感性问题调查包括是否参加赌博？是否浏览过黄色书刊或影像？是否吸毒？是否偷税漏税？是否在考试中作弊？等。对敏感性问题的调查方案，关键要使被调查者作出真实回答优能保守个人隐私。一旦调查方案设计有误，被调查者就会拒绝配合，所得调查数据将失去真实性。经过多年研究和实践，一些心理学家和统计学家设计了一种调查方案。在这个方案中，被调查者只需要回答以下两个问题中的一个问题，而且只需要回答“是”或“否”。

问题 A：你的生日是否在7月1日之前？
问题 B：你是否在考试中作弊？

这个调查方案看似简单，但为了消除被调查者的顾虑，使被调查者确信其参加这次调查不会泄露个人秘密，在操作中有以下关键点：

被调查者在没有旁人的情况下，独自一人在一个房间内操作呵呵回答问题；
被调查者从一个罐子（罐子里只有白球和红球）里随机抽一个球，确认颜色后即放回。若抽到的是白球，则回答问题A；若抽到的是红球，则回答问题B。

被调查者无论回答问题 \(A\) 或问题 \(B\) ，只需要在答卷上认可的方框内搭够，然后把答卷放入一个密封的投票箱内。

设我们有 \(n\) 张答卷，其中有 \(k\) 张答卷回答“是”。但是我们并不知道此 \(n\) 张答卷中有多少张是回答问题B的，同样无法知道 \(k\) 张回答“是”的答卷中有多少张是回答问题B得。但有两个信息我们是预先知道的，即

当 \(n\) 较大时，任选一人的生日在 \(7\) 月 \(1\) 日之前的概率为 \(0.5\) 。
罐中红球的比率 \(\pi\) 已知。

根据 \((n,k,0.5,\pi)\) 求出问题B回答“是”的比例 \(p\) 。由全概率公式可知：

\[ P(\text{是}) = P(\text{白球})P(\text{是}|\text{白球}) + P(\text{红球})P(\text{是}|\text{红球})。 \]

将 \(P(\text{红球}) = \pi\) ， \(P(\text{白球}) = 1-\pi\) ， \(P(\text{是}|\text{白球}) = 0.5\) ， \(P(\text{是}|\text{红球}) = p\) 代入上式，而 \(P(\text{是})\) 用频率 \(k/n\) 代替，得：

\[ \frac{k}{n} = 0.5 (1-\pi) + p \pi \]

由此得：

\[ p = \frac{k/n - 0.5(1-\pi)}{\pi} \]