18.3. 因子分解定理#
根据以上例子,我们发现定义往往可以论证某一个统计量是充分统计量。但是难以通过定义来寻找那个统计量是充分的。以下我们有因子分解定理,可以帮助我们来寻找。
Theorem 18.1 (因子分解定理)
设总体概率函数为 \(f(x;\theta)\) , \(x_1,\cdots,x_n\) 是样本,则 \(T = T(x_1,x_2,\cdots,x_n)\) 为充分统计量的充分必要条件是:存在两个函数 \(g(t,\theta)\) 和 \(h(x_1,x_2,\cdots,x_n)\) 使得对任意的 \(\theta\) 和任一组观测值 \(x_1,x_2,\cdots,x_n\) ,有
其中, \(g(t,\theta)\) 是通过统计量 \(T\) 的取值而依赖于样本的。
Proof
本定理的一般性结果的证明过程超过了本课程的内容。以下仅考虑离散随机比纳凉的证明。此时概率函数为
首先证明必要性。假定 \(T\) 是充分统计量,所以
与 \(\theta\) 无关。我们将其记为 \(h(x_1,x_2,\cdots,x_n)\) 。令 \(A(t) = \left\{x_1,x_2,\cdots,x_n | T(x_1,x_2,\cdots,x_n) = t\right\}\) 。当样本 \((x_1,x_2,\cdots,x_n) \in A(t)\) 时有
故
其中 \(g(t,\theta) = P(T = t;\theta)\) ,而 \(h(x_1,x_2,\cdots,x_n) = P(X_1=x_1,X_2=x_2,\cdots,X_n = x_n|T=t)\) 与 \(\theta\) 无关。因此,必要性得证。 其次证明充分性。由于
对任意 \((x_1,x_2,\cdots,x_n)\) 和 \(t\) ,满足 \((x_1,x_2,\cdots,x_n)\in A(t)\) 有
该分布与 \(\theta\) 无关,这证明了充分性。
Remark
这里 \(T\) 可以是一维的,也可以是多维的。
Example 18.4
设 \(x_1,x_2,\cdots,x_n\) 是来自于 \(b(1,\theta)\) 的样本。于是, \(x_1,x_2,\cdots,x_n\) 的概率函数为
令 \(t = \sum_{i=1}^n x_i\) , \(g(t,\theta) = (1-\theta)^{n} \left(\theta/(1-\theta)\right)^t\) 且 \(h(x_1,x_2,\cdots,x_n) = 1\) 。根据因子分解定理, \(t\) 是 \(\theta\) 的充分统计量。
Example 18.5
设 \(x_1,x_2,\cdots,x_n\) 是来自于 \(N(\mu,\sigma^2)\) 的样本。
\(x_1,x_2,\cdots,x_n\) 的概率函数为
令 \(t = \bar{x}\) ,
和
根据因子分解定理, \(t=\bar{x}\) 是充分统计量。
\(x_1,x_2,\cdots,x_n\) 的概率函数为
令
和
根据因子分解定理, \(t = \sum_{i=1}^n x_i^2\) 是充分统计量。
\(x_1,x_2,\cdots,x_n\) 的概率函数为
令
和
根据因子分解定理, \(\mathbf{t} = (t_1,t_2)' = (\bar{x},\sum_{i=1}^n x_i^2)'\) 是充分统计量。
以下例子是一个拓展。
Example 18.6
总体分布为指数型分布族,即其概率函数为
如果 \(x_1,x_2,\cdots,x_n\) 是样本,则 \(\sum_{i=1}^n t(x_i)\) 是充分统计量。
Remark
\(\sum_{i=1}^n t(x_i)\) 不仅是充分统计量,还是充分完备统计量。
已经证明某个统计量是充分的。如果我们想要论证另一个统计量也是充分的,那么并不需要从定义或因子分解定理直接出发,我们有以下定理来解决这个问题。
Theorem 18.2
设统计量 \(T\) 是充分统计量,而 \(S\) 也是一个统计量。如果 \(T\) 可以表示为 \(S\) 的函数,即 \(T=\varphi(S)\) ,那么 \(S\) 也是充分统计量。