【 Python高级编程】Pythonz中Pandas表格读取与数据处理

news/2024/7/1 5:48:38

Python中的Pandas表格读取与数据处理

Pandas 是 Python 中一个强大的数据处理与分析库,特别适合处理表格数据。本文将介绍如何使用 Pandas 读取表格文件并进行基本的数据处理操作。

一、读取表格数据

Pandas 可以读取多种格式的表格数据,常见的有 CSV、Excel、SQL 等。

1. 读取 CSV 文件
import pandas as pd

# 读取 CSV 文件
df = pd.read_csv('example.csv')

# 查看前5行数据
print(df.head())
2. 读取 Excel 文件
import pandas as pd

# 读取 Excel 文件
df = pd.read_excel('example.xlsx')

# 查看前5行数据
print(df.head())

二、基本数据处理操作

1. 查看数据结构
# 查看数据基本信息
print(df.info())

# 查看数据统计信息
print(df.describe())
2. 数据筛选与过滤
# 筛选特定列
df_filtered = df[['column1', 'column2']]

# 筛选满足条件的行
df_filtered = df[df['column1'] > 50]

# 查看筛选后的数据
print(df_filtered.head())
3. 数据清洗
# 处理缺失值
df_cleaned = df.dropna()  # 删除包含缺失值的行
df_cleaned = df.fillna(0)  # 用0填充缺失值

# 数据类型转换
df['column1'] = df['column1'].astype(int)

# 查看清洗后的数据
print(df_cleaned.head())
4. 数据聚合与分组
# 按列分组并计算均值
grouped_df = df.groupby('column1').mean()

# 查看分组后的数据
print(grouped_df)
5. 数据可视化

Pandas 可以结合 Matplotlib 进行简单的数据可视化。

import matplotlib.pyplot as plt

# 绘制柱状图
df['column1'].plot(kind='bar')
plt.show()

# 绘制折线图
df['column1'].plot(kind='line')
plt.show()

三、总结

通过本文的介绍,您了解了如何使用 Pandas 读取表格数据并进行基本的数据处理操作。Pandas 提供了丰富的功能,使得数据处理和分析变得简单高效。希望这些内容能帮助您更好地掌握 Pandas,提升数据处理能力。


http://lihuaxi.xjx100.cn/news/2215774.html

相关文章

17个关键方法指南,保护您的web站点安全!

了解如何让您的web应用程序或网站安全,对于网站所有者来说至关重要。以下是一些关键步骤,可以帮助您保护网站免受攻击和数据泄露。 1.使用公钥加密技术 当数据以明文形式传输时,它容易受到中间人 (MitM) 攻击。这意味…

LVS ipvsadm命令的使用(二)

目录 上篇:负载均衡集群(一)-CSDN博客 命令参数概述 调度算法 基本命令 1. 添加虚拟服务器 2. 添加真实服务器 3. 删除虚拟服务器 4. 删除真实服务器 5. 列出当前配置 6. 修改服务器权重 7.保存规则 8. 清除所有配置 进行增加虚拟…

【数组基础知识】

二维数组 我的理解是,如果内层有值,外层打印就是地址值。如果内层没值,外层打印就是null。 int[][]a new int [3][]; 这样打印a[0]的时候是null。 打印a[0][0]会报错。 int[][]a new int [3][1]; 这样打印a[0]的时候是地址值。 打印a…

【CTF Web】CTFShow 探针泄露 Writeup(PHP+探针泄露+信息收集)

探针泄露 10 对于测试用的探针,使用完毕后要及时删除,可能会造成信息泄露 解法 查看网页源代码。 view-source:https://11170dfe-84c7-4fde-b1ca-5d1ec3dd7570.challenge.ctf.show/没有找到有用的信息。 用 dirsearch 扫描。 dirsearch -u https://1…

0403用代入法求解递归式-分治策略-算法导论第三版

文章目录 1.代入法求解递归式步骤1.1 求解步骤1.2 边界条件 2.做出好的猜测3.微妙的细节4.避免陷阱5.改变变量 结语 1.代入法求解递归式步骤 1.1 求解步骤 代入法求解递归式分两步: 猜测解的形式。用数学归纳法求出解中的常数,并证明解是正确的。 当…

面试官:Java中缓冲流真的性能很好吗?我看未必

一、写在开头 上一篇文章中,我们介绍了Java IO流中的4个基类:InputStream、OutputStream、Reader、Writer,那么这一篇中,我们将以四个基类所衍生出来,应对不同场景的数据流进行学习。 二、衍生数据流分类 我们上面…

MyBatis操作数据库(一)

什么是MyBatis? MyBatis是一个优秀的持久层框架,⽤于简化JDBC的开发。 MyBatis本是Apache的⼀个开源项⽬iBatis,2010年这个项目由apache迁移到了googlecode,并且改名为MyBatis。 简单来说MyBatis是更加简单完成数据和数据库交互的框架 什么…

linux中acl策略

文档归属的局限性 - 任何人只属于三种角色:属主 属组 其他人- 无法实现更精细的控制 acl访问策略 - 能够对个别用户个别组设置独立的权限- 大多数挂载ext3/4,xfs文件系统默认已支持 Usage: setfacl [-bkndRLP] { -m|-M|-x|-X ... } file ...setfacl [选项] u:用户名…