classification_report分类报告的含义

classification_report分类报告的含义

news/2024/7/2 23:12:22

classification_report分类报告

基础知识
- 混淆矩阵（Confusion Matrix）
- TP、TN、FP、FN
- 精度（Precision）
- 准确率（Accuracy）
- 召回率（Recall）
- F1分数（F1-score）
classification_report分类报告

基础知识

混淆矩阵（Confusion Matrix）

可以看出来类别之间相互误分的情况，查看是否有特定的类别相互混淆，能够帮我们调整后续模型，比如一些类别设置权重衰减。

	预测为正类别	预测为负类别
实际为正类别	True Positive (TP)	False Negative (FN)
实际为负类别	False Positive (FP)	True Negative (TN)

TP、TN、FP、FN

TP（True Positives）：预测为正类别，并且预测对了
TN（True Negatives）：预测为负类别，而且预测对了
FP（False Positives）：预测为正类别，但是预测错了
FN（False Negatives）：预测为负类别，但是预测错了

精度（Precision）

精确率表示模型预测为正类别的样本中有多少是真正的正类别。
$Precision=\frac{TP}{TP+FP}$

准确率（Accuracy）

正确分类的样本占总样本数的比例。
$Accuracy=\frac{TP+TN}{TP+TN+FP+FN}$

召回率（Recall）

在所有实际为正类别的样本中，模型能够正确预测为正类别的比例。
$Recall=\frac{TP}{TP+FN}$
高召回率意味着模型能够有效地捕捉到实际为正类别的样本。

与Precision的关系：负相关。

F1分数（F1-score）

F1 分数的取值范围是 [0, 1]，越接近 1 表示模型的性能越好，同时考虑到了模型在查准率和查全率之间的平衡。
$F1=\frac{2×(Precision×Recall)}{Precision+Recall}$

classification_report分类报告

Python代码中使用“classification_report(Y_test,Y_prediction)”可以查看分类报告，其中Y_test为真实标签、Y_prediction为预测结果。

这里以一个数据量为10大小的二分类为例子，方便手算来理解一遍分类报告。

输入如下Python代码：

from sklearn.metrics import classification_report
Y_test=[0, 0, 0, 0, 0, 1, 1, 1, 1, 1]
Y_prediction=[0, 1, 0, 0, 0, 1, 1, 0, 0, 1]
print(classification_report(Y_test,Y_prediction))

得到该10个数据的二分类的分类报告：
在这里插入图片描述
先画个混淆矩阵：

	预测为1	预测为0
实际为1	3	2
实际为0	1	4

给出了每类别对应的精度（Precision）、召回率（Recall）F1分数（F1-score）、真实中有多少个是该类别的（Support）、准确率（Accuracy）、宏平均（macro avg）和加权平均（weighted avg）。

Precision：预测为x的样本中，有多少被正确预测为x。
Precision_0=4/(2+4)=0.67
Precision_1=3/(3+1)=0.75

Recall：实际为x的类别中，有多少预测为x。
Recall_0=3/5=0.60
Recall_1=4/5=0.80

F1分数：2×Precision×Recall /(Precision+Recall)。

Accuracy：全部样本里被分类正确的比例。
Accuracy=7/10

macro avg：上面类别各分数的直接平均。
macro avg_precision=(0.67+0.75)/2=0.71

weighted avg：上面类别各分数的加权（权值为support）平均。
macro avg_precision=(0.675+0.755)/10=0.71

http://lihuaxi.xjx100.cn/news/1776482.html

相关文章

MySQL窗口函数——让查询变得更简单

MySQL窗口函数——让查询变得更简单

文章目录一、窗口函数概述1、什么是窗口函数2、窗口函数有哪些（1）聚合函数（聚合函数不是本文讨论的重点）（2）专用窗口函数 3、基本语法4、测试数据准备二、窗口函数使用1、初识窗口函数：使用聚…

阅读更多...

k8s docker cgroup驱动问题 —— 筑梦之路

k8s docker cgroup驱动问题 —— 筑梦之路

cgroup作用是什么？ 在 Linux 操作系统上，控制组（CGroup）用于限制分配给进程的资源。 kubelet 和底层容器运行时都需要对接控制组来强制执行为 Pod 和容器管理资源并为诸如 CPU、内存这类资源设置请求和限制。若要对接控制组&a…

阅读更多...

java 读取excel/word存入mysql

java 读取excel/word存入mysql

引入依赖 <dependency><groupId>org.apache.poi</groupId><artifactId>poi</artifactId><version>4.0.1</version></dependency><dependency><groupId>org.apache.poi</groupId><artif…

阅读更多...

有关自动化的脚本思考 python 按键 javascript

有关自动化的脚本思考 python 按键 javascript

start 说来其实挺巧的，去年年中的时候，有一个同组的同事，由于工作流程需要，经常会打开某一网页，填写某些信息，然后上传特定的代码。他有一次和我闲聊，他吐槽说，他每天的时间会被这…

阅读更多...

『MySQL快速上手』-⑦-基本查询

『MySQL快速上手』-⑦-基本查询

文章目录 1.Create 创建1.1 单行数据 + 全列插入1.2 多行数据 + 指定列插入1.3 插入否则更新1.4 替换2. Retrieve 读取2.1 select 列2.1.1 全列查询2.1.2 指定列查询2.1.3 查询字段为表达式2.1.4 为查询结果指定别名2.1.5 结果去重2.2 where 条件2.2.1 英语不及格的同学及英语成…

阅读更多...

2023.11.10 hadoop,hive框架概念,基础组件

2023.11.10 hadoop,hive框架概念,基础组件

目录分布式和集群的概念: hadoop架构的三大组件:Hdfs,MapReduce,Yarn 1.hdfs 分布式文件存储系统 Hadoop Distributed File System 2.MapReduce 分布式计算框架 3.Yarn 资源调度管理框架三个组件的依赖关系是: hive数据仓库处理工具 hive的大体流程: Apache hive的…

阅读更多...

MATLAB算法实战应用案例精讲-【目标检测】机器视觉-工业相机参数

MATLAB算法实战应用案例精讲-【目标检测】机器视觉-工业相机参数

目录前言知识储备相机镜头工作原理算法原理相机模型坐标系

阅读更多...

vue实战——路由访问权限【详解】

vue实战——路由访问权限【详解】

路由访问权限逻辑有的页面无需用户登录即可查看，如登录页、注册页、找回密码页、主页、对外公开的其他页面等。有的页面需要用户登录后才能查看，如用户中心、博客编辑页等。核心技术 Vue Router 路由守卫 https://blog.csdn.net/weixin_41192489/artic…

阅读更多...

最新文章