7.3. 连续随机变量函数的分布#
7.3.1. \(g(X)\) 是一个离散型随机变量#
倘若 \(Y=g(X)\) 是一个离散型随机变量,我们只需要将 \(Y\) 的所有可能取值一一列出,在球 \(Y\) 的取各个可能值的概率。
Example 7.2
若 \(X\) 服从正态分布 \(N(\mu,\sigma^2)\) ,则
那么, \(Y\) 服从二点分布 \(b(1,0.5)\) 。
7.3.2. \(g(\cdot)\) 是严格单调函数#
当 \(g(x)\) 是一个关于 \(x\) 的严格单调函数,我们有以下定理。
Theorem 7.1
设 \(X\) 是连续随机变量,其密度函数为 \(p_{X}(x)\) 。 \(Y=g(X)\) 是另一个连续随机变量。若 \(y=g(x)\) 严格单调,其反函数 \(h(y)\) 有连续导函数,则 \(Y=g(X)\) 的密度函数为
其中, \(a=\min\left \{ g(-\infty ),g(+\infty ) \right \} ,b=\max\left \{ g(-\infty ),g(+\infty ) \right \}\)
Proof
不妨设 \(g(x)\) 是一个严格单调增函数,这时它的反函数 \(h(y)\) 也是严格单调增函数,且 \(h'(y)>0\) 。 首先,考虑 \(Y\) 的取值范围。记 \(a = \min\{g(-\infty),g(\infty)\}\) , \(b = \max\{g(-\infty),g(\infty)\}\) 。于是, \(Y=g(X)\) 仅在区间 \((a,b)\) 取值。 其次,考虑 \(Y\) 的分布函数和密度函数。
若 \(y\leq a\) ,那么 \(P(Y\leq y) = 0\) ,则 \(p_Y(y) = 0\) ;
若 \(y\geq b\) ,那么 \(P(Y\leq y) = 1\) ,则 \(p_Y(y) = 0\) ;
若 \(a< y<b\) ,那么 \(Y\) 的分布函数为
\(Y\) 的密度函数为
类似地,因为 \(g(x)\) 是严格单调减函数,其反函数 \(h(y)\) 也是严格单调减函数,所以 \(h'(y)<0\) 。因此,结论中 \(h'(y)\) 需要绝对值符号。
Example 7.3
设随机变量 \(X\) 服从正态分布 \(N(\mu ,\sigma^{2})\) ,则当 \(a \neq 0\) 时,有 \(Y=aX+b\sim N(a\mu+b,a^{2}\sigma^{2})\) .
Solution
若 \(a>0\) , \(y=g(x)=ax+b\) 是严格增函数。仍在 \((-\infty,+\infty)\) 上取值,其反函数 \(x=h(y)=\frac{y-b}{a}\) 。由上述定理可知,
因此, \(Y\sim N((a\mu+b,a^{2}\sigma^{2})\) 。
若 \(a<0\) ,证明结果类似,学生可以在课后进行补充。
Example 7.4
设随机变量 \(X\sim N(\mu,\sigma^{2})\) ,则 \(Y=e^{X}\) 的概率密度函数为
Solution
因为 \(y=g(x)=e^{x}\) 是严格单调递增函数,它仅在 \((0,+\infty)\) 上取值,其反函数 \(x=h(y)=lny\),而 \(h'(y)=\frac{1}{y}\),根据定理可知,
Remark
这个分布称为对数正态分布 \(\omega \left(\mu, \sigma^{2}\right)\) 。
Example 7.5
设 \(X\sim Ga(\alpha,r)\) ,则当 \(k>0\) 时,有 \(Y=kX\sim Ga(\alpha,\frac{r}{k})\) 。
Solution
因为 \(k>0\) ,所以 \(y=kx\) 是严格增函数,它仍在 \((0,+\infty)\) 上取值,其反函数 \(x=\frac{y}{k}\) 。
当 \(y<0\) 时, \(p_{Y}(y)=0\) ;
当 \(y\ge0\) 时,我们根据上述定理有
即 \(Y\sim Ga(\alpha,\frac{\lambda}{k})\) 。
Corollary 7.1
若随机变量 \(X\) 的分布函数 \(F_{X}(x)\) 为严格单调增的连续函数,其反函数 \(F_{X}^{-1}(y)\) 存在,则 \(Y=F_{X}(X)\) 服从 \((0,1)\) 上的均匀分布 \(U(0,1)\) 。
Proof
首先注意到 \(Y=F_{X}(X)\) 是一个随机变量,于是,我们需要求其分布函数。由于根据分布函数的有界性,分布函数 \(F_{X}(x)\) 仅在 \([0,1]\) 区间上取值,故当 \(y<0\) 时,因为 \(\left \{ F_{X}(X)\leq y \right \}\) 是不可能事件,所以
当 \(y\geq 1\) 时,因为 \(\left \{ F_{X}(X)\le y \right \}\) 是必然事件,所以
当 \(0\leq y<1\) 时,有
综上所述, \(Y=F_{X}(X)\) 的分布函数为
因此, \(Y\sim U(0,1)\) 。
Remark
任一个连续随机变量 \(X\) 都可通过其分布函数 \(F(x)\) 与均匀分布随机变量 \(U\) 有关联。
\(X\sim {Exp}(\lambda)\) ,其分布函数 \(F(x)=1-e^{-\lambda x}\) 。于是,
这表明了由均匀分布 \(U(0,1)\) 的随机数 \(u_{i}\) 可得指数分布 \({Exp}(\lambda)\) 的随机数
这是 Monte Carlo 法的基础。
7.3.3. \(g(\cdot)\) 是其他特殊形式#
Example 7.6
\(X\sim N(0,1)\) ,求 \(Y=X^{2}\) 的密度函数。
Solution
先求 \(Y\) 的分布函数 \(F_{Y}(y)\) 。由于 \(Y=X^{2}\ge 0\) ,故当 \(y\leq 0\) 时,有 \(F_{Y}(y)=0\) ,从而 \(P_{Y}(y)=0\) . 当 \(y>0\) 时,有
因此, \(Y\) 的分布函数为
再用求导的方式求出 \(Y\) 的密度函数
称 \(Y\) 服从自由度为 \(1\) 的卡方分布,记 \(\chi ^{2}(1)\) 。
Remark
可以发现,这个分布也是伽马分布,即 \(Ga(\frac{n}{2},\frac{1}{2})=\chi ^{2}(n)\) 。