拟合思想

19.3. 拟合思想#

拟合思想是目前大部分机器学习模型,乃至深度学习模型,参数(或权重)的学习本质上就是给定一个复杂的模型框架,使其尽可能贴合数据,这就是拟合。在数理统计中,最小二乘估计是利用拟合思想来构造的估计方法。在后续的课程中,我们将详细地介绍最小二乘估计。这里我们介绍一个简单的例子。

Example 19.4

总体分布 \(X\sim N(\mu,1)\) ,而 \(x_1,x_2,\cdots,x_n\) 是样本。我们想要估计 \(\mu\) 。因为 \(\mu\) 是总体分布的期望,每一个样本 \(x_1,x_2,\cdots,x_n\) 都在 \(\mu\) 附近波动。我们想要找到一个实数 \(c\) 与这些样本最接近。于是,我们需要定义一个损失函数

\[\begin{split} l(c) = \sum_{i=1}^n g(|x_i - c|) = \sum_{i=1}^n |x_i - c|^{k} =\left\{ \begin{aligned} &\sum_{i=1}^n |x_i - c|^2 , &\text{如果 $k=2$ };\\ &\sum_{i=1}^n |x_i - c| , &\text{如果 $k=1$ }. \end{aligned} \right. \end{split}\]

拟合思想促使我们所得到的估计为

\[ \hat{\mu} = \arg\min_{c} l(c). \]

\(k=2\) 时,则损失函数定义为 \(l(c) = \sum_{i=1}^n (x_i-c)^2\) 。我们需要求 \(l(c)\) 的最小值点,则对 \(l(c)\) 求导,即

\[ \frac{\partial l(c)}{\partial c} = -2 \sum_{i=1}^n (x_i-c). \]

\(\frac{\partial l(c)}{\partial c} = 0\) 。所以,

\[ c = \frac{1}{n} \sum_{i=1}^n x_i = \bar{x}. \]

因此,我们通常称 \(\bar{x}\)\(\mu\) 的最小二乘估计。

Question

\(k=1\) 时,则损失函数定义为 \(l(c) = \sum_{i=1}^n |x_i-c|\) 。通过最小化 \(l(c)\) 可以得到最小一乘估计。这个最小一乘估计是什么?