简单粗暴理解与实现机器学习之逻辑回归:逻辑回归介绍、应用场景、原理、损失以及优化...

news/2024/9/18 4:09:45

作者 | 汪雯琦

责编 | Carol

来源 | CSDN 博客

出品 | AI科技大本营(ID:rgznai100)

学习目标

  • 知道逻辑回归的损失函数

  • 知道逻辑回归的优化方法

  • 知道sigmoid函数

  • 知道逻辑回归的应用场景

  • 应用LogisticRegression实现逻辑回归预测

  • 知道精确率、召回率指标的区别

  • 知道如何解决样本不均衡情况下的评估

  • 了解ROC曲线的意义说明AUC指标大小

  • 应用classification_report实现精确率、召回率计算

  • 应用roc_auc_score实现指标计算

逻辑回归介绍

逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归,但是它与回归之间有一定的联系。由于算法的简单和高效,在实际中应用非常广泛。

逻辑回归的应用场景:

  • 广告点击率

  • 是否为垃圾邮件

  • 是否患病

  • 金融诈骗

  • 虚假账号

看到上面的例子,我们可以发现其中的特点,那就是都属于两个类别之间的判断。逻辑回归就是解决二分类问题的利器。


逻辑回归的原理

要想掌握逻辑回归,必须掌握两点:

  • 逻辑回归中,其输入值是什么

  • 如何判断逻辑回归的输出

1、输入

逻辑回归的输入就是一个线性回归的结果。

2、激活函数

  • sigmoid函数

  • 判断标准

  • 回归的结果输入到sigmoid函数当中

  • 输出结果:[0, 1]区间中的一个概率值,默认为0.5为阈值

逻辑回归最终的分类是通过属于某个类别的概率值来判断是否属于某个类别,并且这个类别默认标记为1(正例),另外的一个类别会标记为0(反例)。(方便损失计算)

输出结果解释(重要):假设有两个类别A,B,并且假设我们的概率值为属于A(1)这个类别的概率值。现在有一个样本的输入到逻辑回归输出结果0.6,那么这个概率值超过0.5,意味着我们训练或者预测的结果就是A(1)类别。那么反之,如果得出结果为0.3那么,训练或者预测结果就为B(0)类别。

所以接下来我们回忆之前的线性回归预测结果我们用均方误差衡量,那如果对于逻辑回归,我们预测的结果不对该怎么去衡量这个损失呢?我们来看这样一张图。

那么如何去衡量逻辑回归的预测结果与真实结果的差异呢?

损失以及优化

1、损失

逻辑回归的损失,称之为对数似然损失,公式如下:

  • 分开类别:

怎么理解单个的式子呢?这个要根据log的函数图像来理解

  • 综合完整损失函数

看到这个式子,其实跟我们讲的信息熵类似。

接下来我们就带入上面那个例子来计算一遍,就能理解意义了。

我们已经知道,log§, P值越大,结果越小,所以我们可以对着这个损失的式子去分析

2、优化

同样使用梯度下降优化算法,去减少损失函数的值。这样去更新逻辑回归前面对应算法的权重参数,提升原本属于1类别的概率,降低原本是0类别的概率。

【end】

原力计划

《原力计划【第二季】- 学习力挑战》正式开始!即日起至 3月21日,千万流量支持原创作者!更有专属【勋章】等你来挑战

推荐阅读

  • Python数据清理终极指南(2020版)

  • 无需3D运动数据训练,最新人体姿势估计方法达到SOTA | CVPR 2020

  • 前端 Webpack 工程化的最佳实践

  • 如何与亦敌亦友的 null 说拜拜?大神原来是这么做的!

  • 从哈希函数、哈希冲突、开散列出发,一文告诉你哈希思想与哈希表构造到底是什么!

  • 罗永浩欲直播带货,京东说可以帮忙联系

  • 你点的每个“在看”,我都认真当成了AI


http://lihuaxi.xjx100.cn/news/272500.html

相关文章

怪我不懂你

坐了很久的公交去买火车票。嗯,决定了,去武汉。 其实这次真的不确定是不是可以开心着回来,但是,总是这样我会死掉的。就算是死,我也想死的明白一点,死的瞑目。等不了了。 写下上面的文字的时候我已经从武汉…

再见吧,996!程序员开源考公指南获高赞:三人已成功上岸

点击上方“视学算法”,选择加"星标"或“置顶”重磅干货,第一时间送达整理 | 钰莹转载自公众号:AI前线近年来,互联网公司 996 和职场 PUA 现象见怪不怪,加之疫情影响下的工作不稳定,很多程序员考虑…

网络爬虫流程与注意事项

在写爬虫之前,还是需要了解一些爬虫的基础知识,如 HTTP 原理、网页的基础知识、爬虫的基本原理、Cookies 基本原理等。 网络蜘蛛是一个很形象的名字。如果把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过 网页…

3D视觉检测的未来:光度立体技术

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达利用3D表面定向,特别是它对反射光的影响,工业应用的光度立体产生对比度图像,突出了局部3D表面变化。由于有了专门的新算法,…

djongo:Django和MongoDB连接器

在Django项目中使用MongoDB作为后端数据库,且不改变Django的ORM框架。实现Django用户管理程序对MongoDB数据库中文件的增加和修改。 用法 1.pip install djongo 2.在Django项目下的setting.py中增加如下代码: DATABASES {default:{ENGINE:djongo,NAME:yo…

辞职之后的思考--激励

本人曾拿过多次奖金,也曾与很多同事沟通过拿奖金的感觉,引发一些思考,这其实也是希望在以后有机会给别人发奖金时做参考之用。   并不是所有人都会有奖金,所以如果我没有奖金其实也没有什么关系,但是,我非…

AI+大数据助力抗疫,带你认识百度地图的新玩法!

作者 | Aholiab责编 | Carol出品 | AI科技大本营(ID:rgznai100)“喂,你好,我是百度地图的客服,请问是xx店铺对吗?”“嗯,什么事?”“您家在疫情期间还照常营业,对吗&…

滴滴开源了哪些有意思的项目?

点击上方“方志朋”,选择“设为星标”回复”666“获取新整理的面试文章作者 | 滴滴技术 出品 | 滴滴技术作为卓越的一站式移动出行和生活平台,滴滴在亚洲、拉美和澳洲为超过5.5亿用户提供出租车、快车、专车、豪华车、公交、代驾、企业级、共享单车、共…