拟合思想

19.3. 拟合思想#

拟合思想是目前大部分机器学习模型，乃至深度学习模型，参数（或权重）的学习本质上就是给定一个复杂的模型框架，使其尽可能贴合数据，这就是拟合。在数理统计中，最小二乘估计是利用拟合思想来构造的估计方法。在后续的课程中，我们将详细地介绍最小二乘估计。这里我们介绍一个简单的例子。

Example 19.4

总体分布 $X\sim N(\mu,1)$ ，而 $x_1,x_2,\cdots,x_n$ 是样本。我们想要估计 $\mu$ 。因为 $\mu$ 是总体分布的期望，每一个样本 $x_1,x_2,\cdots,x_n$ 都在 $\mu$ 附近波动。我们想要找到一个实数 $c$ 与这些样本最接近。于是，我们需要定义一个损失函数

\[\begin{split} l(c) = \sum_{i=1}^n g(|x_i - c|) = \sum_{i=1}^n |x_i - c|^{k} =\left\{ \begin{aligned} &\sum_{i=1}^n |x_i - c|^2 , &\text{如果 $k=2$ };\\ &\sum_{i=1}^n |x_i - c| , &\text{如果 $k=1$ }. \end{aligned} \right. \end{split}\]

拟合思想促使我们所得到的估计为

\[ \hat{\mu} = \arg\min_{c} l(c). \]

当 $k=2$ 时，则损失函数定义为 $l(c) = \sum_{i=1}^n (x_i-c)^2$ 。我们需要求 $l(c)$ 的最小值点，则对 $l(c)$ 求导，即

\[ \frac{\partial l(c)}{\partial c} = -2 \sum_{i=1}^n (x_i-c). \]

令 $\frac{\partial l(c)}{\partial c} = 0$ 。所以，

\[ c = \frac{1}{n} \sum_{i=1}^n x_i = \bar{x}. \]

因此，我们通常称 $\bar{x}$ 为 $\mu$ 的最小二乘估计。

Question

当 $k=1$ 时，则损失函数定义为 $l(c) = \sum_{i=1}^n |x_i-c|$ 。通过最小化 $l(c)$ 可以得到最小一乘估计。这个最小一乘估计是什么？