博客
关于我
[Python] Pandas 数据表的处理和数据运算
阅读量:431 次
发布时间:2019-03-06

本文共 1676 字,大约阅读时间需要 5 分钟。

数据表的处理

1.1 转置数据表的行列

在pandas中,使用T方法可以将数据表的行和列进行转置。以下示例展示了如何将数据表的列转化为行标签。

import pandas as pddata = pd.read_csv('D:\git\python\code\第5章\产品统计表.csv')a = data.Tprint(a)

1.2 将数据表转换为树形结构

将数据表转换为树形结构可以通过stack()方法实现,这样可以将数据表的列标签也转化为行标签,形成层次化的数据结构。

data = pd.read_excel('D:\git\python\code\第5章\产品统计表3.xlsx')print(data.stack())

1.3 数据表的拼接

数据表的拼接是指将两个或多个数据表合并为一个数据表。在pandas中可以使用merge()concat()append()函数来实现不同的拼接方式。

merge函数

merge()函数用于按键合并两个数据表。以下是使用merge()函数的示例:

data1 = pd.read_excel('D:\git\python\code\第5章\产品表.xlsx', sheet_name=0)data2 = pd.read_excel('D:\git\python\code\第5章\产品表.xlsx', sheet_name=1)print(pd.merge(data1, data2))

concat函数

concat()函数用于全连接两个或多个数据表,可以将不同表的数据合并到同一个表中。以下是使用concat()函数的示例:

print(pd.concat([data1, data2], ignore_index=True))

append函数

append()函数用于将一个或多个数据表的数据添加到另一个数据表中。以下是使用append()函数的示例:

g = data1.append({'员工编号':'a005', '员工姓名':'孙七', '员工性别':'男'}, ignore_index=True)print(g)

2. 数据的运算

2.1 数据的统计运算

pandas模块中提供了多种统计函数,如sum()mean()max()min(),可以用于数据表中的数值计算。

data = pd.read_csv('D:\git\python\code\第5章\产品统计表.csv')print(data.sum())print(data['利润(元)'].sum())

2.2 获取数值分布情况

describe()函数可以用来获取数据表中数值数据的分布情况,包括均值、最值、标准差等统计指标。

data.describe()print(data['利润(元)'].describe())

2.3 计算相关系数

corr()函数可以计算数据表中不同列之间的相关系数,用于衡量变量之间的相关性。

data = pd.read_excel('D:\git\python\code\第5章\相关性分析.xlsx')print(data.corr())

2.4 分组汇总数据

groupby()函数可以对数据表进行分组汇总,按指定的分组键对数据进行聚合计算。

data = pd.read_csv('D:\git\python\code\第5章\产品统计表.csv')data.groupby('产品')['数量(个)','利润(元)'].sum()

2.5 创建数据透视表

pivot_table()函数可以用于创建数据透视表,快速对数据表中的数据进行分组和计算。

pd.pivot_table(data, values=['利润(元)', '成本(元)'], index='产品', aggfunc='sum')pd.pivot_table(data, values=['利润(元)', '成本(元)'], index=['产品', '编号'], aggfunc='sum')

转载地址:http://kwjuz.baihongyu.com/

你可能感兴趣的文章
oracle 限制用户并行,insert /*parallel */ 到不同用户,并行起不来的问题
查看>>
oracle--用户,权限,角色的管理
查看>>
Oracle-定时任务-JOB
查看>>
oracle.dataaccess 连接池,asp.net使用Oracle.DataAccess.dll连接Oracle
查看>>
oracle00205报错,Oracle控制文件损坏报错场景
查看>>
Oracle10g EM乱码之快速解决
查看>>
Oracle10g下载地址--多平台下的32位和64位
查看>>
Oracle10g安装了11g的ODAC后,PL/SQL连接提示TNS:无法解析指定的连接标识符
查看>>
oracle11g dataguard物理备库搭建(关闭主库cp数据文件到备库)
查看>>
Oracle11G基本操作
查看>>
Oracle11g服务详细介绍及哪些服务是必须开启的?
查看>>
Oracle11g静默安装dbca,netca报错处理--直接跟换操作系统
查看>>
oracle12安装软件后安装数据库,然后需要自己配置监听
查看>>
Oracle——08PL/SQL简介,基本程序结构和语句
查看>>
Oracle——distinct的用法
查看>>
Oracle、MySQL、SQL Server架构大对比
查看>>
oracle下的OVER(PARTITION BY)函数介绍
查看>>
Oracle中DATE数据相减问题
查看>>
Oracle中merge into的使用
查看>>
oracle中sql查询上月、本月、上周、本周、昨天、今天的数据!
查看>>