每天5分钟快速玩转机器学习:贝叶斯算法的局限性

news/2024/7/8 0:31:58

本文重点

贝叶斯算法的应用很广泛,其中最经典的应用就是垃圾邮件的分类,本节课程通过垃圾邮件的例子来看一下贝叶斯算法存在的一些问题,我们应该如何解决它?

垃圾邮件分类

给定一封电子邮件,我们如何判断这封电子邮件是垃圾邮件还是正常邮件,这是机器学习中的二分类问题。如果我们选择使用朴素贝叶斯分类器,那目标就是判断P(“垃圾邮件”|“具有某特征”)是否是否大于1/2(因为是二分类的问题)。

假如现在我们拥有垃圾邮件5000封,正常邮件5000封,现在有一封邮件为:

恭喜!您的条件已达标,特通知您获得申请金卡资格

那么我们如何判断这封邮件是垃圾邮件,我们只需要计算下面的概率

P(“垃圾邮件”|“恭喜!您的条件已达标,特通知您获得申请金卡资格”)

它等于:

 

但是这样算有一个问题,因为完完整整拥有这句话的邮件太少了,(无论是垃圾邮件还是非垃圾邮件),所以这是一个问题。

那么我们可以不从句子的角度来进行处理,我们可以从分词的角度来进行处理。

恭喜!您的条件已达标,特通知您获得申请金卡资格可以处理为(恭喜,您,的,条件&#x


http://lihuaxi.xjx100.cn/news/980169.html

相关文章

Android13 音量曲线调整

Android13 音量曲线调整 Android13 上配置文件的路径: /vendor/sprd/modules/audio/engineconfigurable_apm/工程目录/system/etc/audio_engine_config/audio_policy_engine_stream_volumes.xml /vendor/sprd/modules/audio/engineconfigurable_apm/工程目录/sys…

Oracle 数据库相关信息清单列表

Oracle 数据库相关信息清单列表 一、设置Oracle安装目录 Oracle基目录(ORACLE_BASE):D:\databases\oracle\oracle_11g\app\Administrator 软件位置(ORACLE_HOME):D:\databases\oracle\oracle_11g\app\Administrator\product\11.2.0\dbhome_1 数据库文件位置:D:\databa…

lc23. 合并K个升序链表

题目描述给你一个链表数组,每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中,返回合并后的链表。示例 1:输入:lists [[1,4,5],[1,3,4],[2,6]]输出:[1,1,2,3,4,4,5,6]解释:链表数组如下&…

制作一个简单的信用卡验证表

下载:https://download.csdn.net/download/mo3408/87559584 效果图: 您可以从文章顶部附近的下载按钮获取该项目的完整代码。这些文件的概述如下所示: 我们需要将两个 .css 文件和两个 .js 文件包含在我们的 HTML 中。所有其他资源,例如 Bootstrap 框架、jQuery 和 Web 字…

了解国外SEO负面压制的现状与应对策略!

随着全球化的发展,越来越多的企业和品牌开始将目光转向海外市场,而谷歌作为全球最大的搜索引擎之一,也成为了外贸企业最主要的搜索引擎之一。 然而,随着谷歌的不断发展,国外SEO负面压制的现状也愈发严峻,外…

Spring——AOP核心概念和AOP入门案例

AOP:面向切面编程,一种编程范式,指导开发者如何组织程序结构 作用:在不惊动原始设计的基础上进行功能增强 Spring理念:无侵入式编程 比如测试一个方法的万次执行时间,原本没有Aop需要这样写 public void save() {Long stSystem.currentTim…

【Python语言基础】——Python MongoDB

Python语言基础——Python MongoDB 文章目录Python语言基础——Python MongoDB一、Python MongoDB一、Python MongoDB Python 可以在数据库应用程序中使用。 最受欢迎的 NoSQL 数据库之一是 MongoDB。 MongoDB MongoDB 将数据存储在类似 JSON 的文档中,这使得数据库…

深入剖析Java的四大神器:单元测试、反射、注解、动态代理

随着软件开发行业的发展,软件质量成为越来越重要的议题。在保证软件质量的同时,开发人员也需要快速、高效地开发出功能完善的软件。而单元测试、反射、注解和动态代理正是四个有助于提高软件质量和开发效率的重要工具。 本篇博客将详细讲解这四个工具在J…