机器学习(三) -- 特征工程(更新中)

news/2024/7/7 23:32:39

系列文章目录

未完待续……


目录

系列文章目录


前言

tips:这里只是总结,不是教程哈。

“***”开头的是给好奇心重的宝宝看的,其实不太重要可以跳过。

此处以下所有内容均为暂定,因为我还没找到一个好的,让小白(我自己)也能容易理解(更系统、嗯应该是宏观)的讲解顺序与方式。

第一文主要简述了一下机器学习大致有哪些东西(当然远远不止这些),对大体框架有了一定了解。接着我们根据机器学习的流程一步步来学习吧,掐掉其他不太用得上我们的步骤,精练起来就4步(数据预处理,特征工程,训练模型,模型评估),其中训练模型则是我们的重头戏,基本上所有算法也都是这一步,so,这个最后写,先把其他三个讲了,然后,在结合这三步来进行算法的学习,兴许会好点(个人拙见)。


一、特征工程简介

为什么需要特征工程?

数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。所以需要在特征上下功夫。

1、特征工程定义:

特征工程是使用一定技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。会直接影响机器学习的效果。

2、特征工程包含内容:

特征提取(特征抽取)、特征预处理、特征降维

二、特征提取

1、定义

将任意数据(如文本或图像)转换为可用于机器学习的数字特征。

2、字典特征提取

3、文本特征提取

三、特征预处理

1、定义

通过一些转换函数,将特征数据转换成更适合算法模型的特征数据的过程。

2、归一化

3、标准化

四、特征降维

1、定义

降维是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程

2、特征选择

3、主成分分析

1.1、嗡嗡嗡

嗡嗡嗡

1.2、十五万

嗡嗡嗡


总结

提示:这里对文章进行总结:

例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。


http://lihuaxi.xjx100.cn/news/1923133.html

相关文章

黑客(网络安全)技术30天速成

1.网络安全是什么 网络安全可以基于攻击和防御视角来分类,我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术,而“蓝队”、“安全运营”、“安全运维”则研究防御技术。 2.网络安全市场 一、是市场需求量高; 二、则是发展相对成熟…

Docker六 | Docker Compose容器编排

目录 Docker Compose 基本概念 使用步骤 常用命令 Docker Compose Docker-Compose是Docker官方的开源项目,负责实现对Docker容器集群的快速编排。Compose可以管理多个Docker容器组成一个应用。 需要定义一个YAML格式的配置文件docker-compose.yml,…

Java EE Servlet之第一个Servlet代码

文章目录 1. Servlet 是什么2. 第一个Servlet 代码2.1 创建一个项目2.2 引入依赖2.3 创建目录2.4 编写代码2.5 打包程序2.6 部署程序2.7 验证程序2.8 更新代码 3. 访问出错了怎么办?3.1 出现 4043.2 出现 4053.3 出现 5003.4 出现空白界面3.5 出现“无法访问此网站”…

数组的声明

概要&#xff1a; 数组的声明分为三个部分 第一部分&#xff1a;数组中元素的数据类型 第二部分&#xff1a;数组名 第三部分&#xff1a;数组标识符(方括号)和数组大小 一、测试代码 #include<stdio.h> int main() {int arr_int[10];char* arr_str[10];arr_in…

Redis主从切换(单点故障)解决源码

1、使用过程&#xff1a; 发布创建channel1消息 redis-cli> PUBLISH channel1 "Hello, world!" redis-cli> SUBSCRIBE channel1 优点&#xff1a; 1、采用Reactor事件单线程去驱动发布订阅事件的&#xff0c;实时性高。 2、从redis架构去思考&#xff0c;拓展哨…

Innosetup 调用c# dll 和 c# dll的函数导出

目标需求&#xff0c;基于现在安装包脚本。需要在用户安装和卸载成功时。进行数据记录,所以需要调用c#dll 主要涉及到的知识点 需要理解脚本的文件使用机制脚本的文件dll加载&#xff0c;和dll的调用c# dll的制作&#xff0c;和工具的使用 下面具体介绍 脚本的文件dll加载&…

【Python排序算法系列】—— 冒泡排序

&#x1f308;个人主页: Aileen_0v0 &#x1f525;热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 &#x1f4ab;个人格言:"没有罗马,那就自己创造罗马~" 冒泡排序 过程演示&#xff1a; 做题实际遇到的图像是横向的&#xff0c;但是它位置变化和纵向是一样…

推荐Kali Linux 2023.4

今天滚动更新了Kali Linux 2023.4&#xff0c;推荐一下。 开发者们推出了该发行版在2023年的第四个也是最后一个新版本。Kali Linux 2023.4&#xff0c;同时包含15种新工具和GNOME 45。 新工具&#xff1a; cabby - TAXII 客户端实现&#xff1b; cti-taxi-client - TAXII2 …