15.4. 补充案例#
Example 15.4 (测量)
每天早上起床我们可以多次测量自己的身高。如果使用精度高的测量仪器来进行数据采集,可以得到一系列数据:166.01 厘米,165.98 厘米,165.89 厘米,166.11 厘米,165.96 厘米, \(\cdots\) 。假设我们测量了 100 万次,那么共有 100 万个数据。于是,我们可以得到一个分布。这里我们可以认为自己的身高是一个总体,其有一个均值,表示我们真实的高度,而每次测量是存在一些偏差。所以,我们定义所测量的数据为
这个式子是所有测量的最简单结构式,放之四海皆准。其中, \(x\) 表示观测值(可以观测到的), \(\mu\) 表示真值(永远未知), \(\varepsilon\) 表示误差(需要假定)。
为了认识 \(\mu\) ,我们需要对误差进行一些假定,才能对 \(\mu\) 做出合理的推断。
假定一: \(\varepsilon \sim N(0,\sigma^{2})\) ,其中 \(\sigma^{2}\) 是未知的。在这个假定中我们利用高斯分布(正态分布) \(N(\mu,\sigma^{2})\) 来刻画测量数据。高斯分布由两个参数唯一确定,其中, \(\mu\) 是我们感兴趣的参数,称为目标参数;而 \(\sigma^{2}\) 是我们不感兴趣的参数,称为讨厌参数(或冗余参数)。
假定二: \(\varepsilon \sim N(0,\sigma^{2}_0)\) ,其中 \(\sigma^{2}_0\) 是已知的。
假定三: \(\varepsilon\) 服从一个以 \(0\) 为中心的对称分布,即 \(x\) 服从一个以 \(\mu\) 为中心的对称分布。这里我们并未对数据的分布给出一个具体的假定。
Remark
与假设一和假设二中参数总体的假定不同,假设三中是非参数总体的假定。
Example 15.5
\(1979\) 年 \(4\) 月 \(17\) 日,日本《朝日新闻》曾刊登过这样的一条消息:美国人喜欢购买日本索尼工厂生产的彩电,而不愿购买设在美国加州的索尼工厂生产的彩电。而美国本土生产的电视机出厂合格率为 \(100\%\) ,日本产的合格率只有 \(99.73\%\) .这究竟是什么原因呢?美国一家咨询公司采用统计抽样的方法,对此进行了专题调查分析。结果发现,两地生产彩电质量特征的概率分布不同。
在美国的工厂中,采用门柱法来进行产品质量管理;而在日本的工厂中,采用 \(3\) - \(\sigma\) 质量管理策略:将产品划分优、良和合格三类,严格控制每一类产品在市场的占比。基于 \(3\) - \(\sigma\) 质量管理策略,日本产品的优良率明显高于美国本土生产的产品。所以更受到美国消费者的青睐。