线性回归

线性回归是线性模型的一种典型方法。产品销量预测、岗位薪资预测，都可以用先线性回归来拟合模型。从某种程度上来说，回归分析不再局限于线性回归这一具体模型和算法，更包含了广泛的由自变量到因变量的机器学习建模思想。

原理

给定一组由输入 $x$ 和输出 $y$ 构成的数据集 $D={(x_1,y_1),\dots,(x_k,y_k)}$ ，其中 $x_i$ 为参数集合。线性回归就是通过不断训练从而得到一个线性模型去尽可能的根据输入 $x$ 拟合出 $y$ 值。

以 $x$ 为影响因素， $y$ 为输出结果，构建回归式： $y=wx_i+b$ ，其中 $w$ 为模型矩阵。

线性回归模型的关键问题是确定 $w$ 和 $b$ 的值，使得拟合输出 $y$ 与真实值 $y_i$ 尽可能接近。在回归任务中，我们通常使用均方误差来度量预测与标签值之间的损失，所以回归任务的优化目标就是使得拟合输出和真实输出之间的均方误差最小化。
$\begin{aligned} f(w^*,b^*)&=argmin\sum_{i=1}^{k}(y-y_i)^2 \\ &=argmin\sum_{i=1}^{k}(wx_i+b-y_i)^2 \end{aligned} \tag{1}$
为求的 $w$ 和 $b$ 的最小化参数 $w^*$ 和 $b^*$ ，可从式 $(1)$ ，分别对 $w$ 和 $b$ 求一阶导为零。

对 $w$ 求导
$\begin{aligned} \frac{\partial f(w,b)}{\partial w}&=\frac{\partial}{\partial w}\Bigg[\sum_{i=1}^{k}(wx_i+b-y_i)^2\Bigg] \\ &=\sum_{i=1}^{k}\frac{\partial}{\partial w}\Big[(y_i-wx_i-b)^2\Big] \\ &=\sum_{i=1}^{k}\big[2\cdot (y_i-wx_i-b)\cdot(-x_i)\big] \\ &=\sum_{i=1}^{k}\Big[2\cdot (wx_i^2-y_ix_i+bx_i)\Big] \\ &=2\cdot\Bigg(w\sum_{i=1}^{k}x_i^2-\sum_{i=1}^{k}y_ix_i+\sum_{i=1}^{k}bx_i\Bigg) \end{aligned} \tag{2}$
对 $b$ 求导
$\begin{aligned} \frac{\partial f(w,b)}{\partial b}&=\frac{\partial}{\partial b}\Bigg[\sum_{i=1}^{k}(wx_i+b-y_i)^2\Bigg] \\ &=\sum_{i=1}^{k}\frac{\partial}{\partial b}\Big[(y_i-wx_i-b)^2\Big] \\ &=\sum_{i=1}^{k}\big[2\cdot (y_i-wx_i-b)\cdot(-1)\big] \\ &=\sum_{i=1}^{k}\Big[2\cdot (b-y_i+wx_i)\Big] \\ &=2\cdot\Bigg(\sum_{i=1}^{k}b-\sum_{i=1}^{k}y_i+\sum_{i=1}^{k}wx_i\Bigg) \\ &=2\cdot\Bigg(kb-\sum_{i=1}^{k}(y_i-wx_i)\Bigg) \end{aligned} \tag{3}$
令式 $(2)$ 为零
$\begin{aligned} \frac{\partial f(w,b)}{\partial w}& =2\cdot\Bigg(w\sum_{i=1}^{k}x_i^2-\sum_{i=1}^{k}y_ix_i+\sum_{i=1}^{k}bx_i\Bigg)=0 \\ &\Leftrightarrow w\sum_{i=1}^{k}x_i^2=\sum_{i=1}^{k}y_ix_i-\sum_{i=1}^{k}bx_i \end{aligned} \tag{4}$
令式 $(3)$ 为零
$\begin{aligned} \frac{\partial f(w,b)}{\partial b}&=2\cdot\Bigg(kb-\sum_{i=1}^{k}(y_i-wx_i)\Bigg)=0 \\ &\Leftrightarrow b=\frac{1}{k}\sum_{i=1}^{k}(y_i-wx_i) \end{aligned} \tag{5}$
又因为：
$\frac{1}{k}\sum_{i=1}^{k}y_i=\bar{y} \\\frac{1}{k}\sum_{i=1}^{k}x_i=\bar{x} \tag{6}$
所以：
$b=\bar{y}-w\bar{x} \tag{7}$
将 $(7)$ 代入 $(4)$ 得
$\begin{aligned} &w\sum_{i=1}^{k}x_i^2=\sum_{i=1}^{k}y_ix_i-\sum_{i=1}^{k}bx_i \\ &w\sum_{i=1}^{k}x_i^2=\sum_{i=1}^{k}y_ix_i-\sum_{i=1}^{k}(\bar{y}-w\bar{x})x_i \\ &w\sum_{i=1}^{k}x_i^2=\sum_{i=1}^{k}y_ix_i-\bar{y}\sum_{i=1}^{k}x_i+w\bar{x}\sum_{i=1}^{k}x_i \\ &w\Bigg(\sum_{i=1}^{k}x_i^2-\bar{x}\sum_{i=1}^{k}x_i\Bigg)=\sum_{i=1}^{k}y_ix_i-\bar{y}\sum_{i=1}^{k}x_i \\ &w=\frac{\sum_{i=1}^{k}y_ix_i-\bar{y}\sum_{i=1}^{k}x_i}{\sum_{i=1}^{k}x_i^2-\bar{x}\sum_{i=1}^{k}x_i} \end{aligned} \tag{8}$
又因为：
$\bar{y}\sum_{i=1}^{k}x_i=\frac{1}{m}\sum_{i=1}^{k}y_i\sum_{i=1}^{k}x_i=\bar{x}\sum_{i=1}^{k}y_i \\ \bar{x}\sum_{i=1}^{k}x_i=\frac{1}{m}\sum_{i=1}^{k}x_i\sum_{i=1}^{k}x_i=\frac{1}{m}\Bigg(\sum_{i=1}^{k}y_i\Bigg)^2 \tag{9}$
所以：
$w=\frac{\sum_{i=1}^{k}y_i(x_i-\bar{x})}{\sum_{i=1}^{k}x_i^2-\frac{1}{m}\Big(\sum_{i=1}^{k}y_i\Big)^2} \tag{10}$

将 $(10)$ 进行向量化

如果想要用 Python 来实现的话， $(10)$ 中的求和运算只能用循环来实现。但是如果能将上式向量化，也就是转换成矩阵运算的话，就可以用 $N u m p y$ 这种专门加速矩阵运算的类库来进行编写。

将 $(9)$ 代回 $(10)$
$\begin{aligned} w&=\frac{\sum_{i=1}^{k}y_i(x_i-\bar{x})}{\sum_{i=1}^{k}x_i^2-\bar{x}\sum_{i=1}^{k}x_i} \\ &=\frac{\sum_{i=1}^{k}(y_ix_i-y_i\bar{x})}{\sum_{i=1}^{k}(x_i^2-x_i\bar{x})} \end{aligned} \tag{11}$
又因为：
$\bar{y}\sum_{i=1}^{k}x_i=\bar{x}\sum_{i=1}^{k}y_i=\sum_{i=1}^{k}\bar{y}x_i=\sum_{i=1}^{k}\bar{x}y_i=k\bar{x}\bar{y}=\sum_{i=1}^{k}\bar{x}\bar{y} \\ \bar{x}\sum_{i=1}^{k}x_i=\sum_{i=1}^{k}x_i\bar{x}=\bar{x}m\frac{1}{k}\sum_{i=1}^{k}x_i=m\bar{x}^2=\sum_{i=1}^{k}\bar{x}^2 \tag{12}$
所以：
$\begin{aligned} w&=\frac{\sum_{i=1}^{k}(y_ix_i-y_i\bar{x}-x_i\bar{y}+\bar{x}\bar{y})}{\sum_{i=1}^{k}(x_i^2-x_i\bar{x}-x_i\bar{x}+\bar{x}^2)} \\ &=\frac{\sum_{i=1}^{k}(x_i-\bar{x})(y_i-\bar{y})}{\sum_{i=1}^{k}(x_i-\bar{x})^2} \end{aligned} \tag{13}$

线性回归（公式推导）

线性回归

原理

相关文章

新开课day12函数进阶作业

什么是DCMM认证？什么是数据管理能力成熟度评估？

无胁科技-TVD每日漏洞情报-2022-9-28

EXPLAIN使用简介

19 南京站+div2思维

drf之day07：drf中的视图集，权限类使用，频率类使用，认证源码分析，权限源码分析，鸭子类型

APS高级排产如何帮助帮助企业制定生产计划？

后端整合 Swagger + Knife4j 接口文档