数据表的处理

1.1 转置数据表的行列

在pandas中，使用T方法可以将数据表的行和列进行转置。以下示例展示了如何将数据表的列转化为行标签。

import pandas as pddata = pd.read_csv('D:\git\python\code\第5章\产品统计表.csv')a = data.Tprint(a)

1.2 将数据表转换为树形结构

将数据表转换为树形结构可以通过stack()方法实现，这样可以将数据表的列标签也转化为行标签，形成层次化的数据结构。

data = pd.read_excel('D:\git\python\code\第5章\产品统计表3.xlsx')print(data.stack())

1.3 数据表的拼接

数据表的拼接是指将两个或多个数据表合并为一个数据表。在pandas中可以使用merge()、concat()和append()函数来实现不同的拼接方式。

merge函数

merge()函数用于按键合并两个数据表。以下是使用merge()函数的示例：

data1 = pd.read_excel('D:\git\python\code\第5章\产品表.xlsx', sheet_name=0)data2 = pd.read_excel('D:\git\python\code\第5章\产品表.xlsx', sheet_name=1)print(pd.merge(data1, data2))

concat函数

concat()函数用于全连接两个或多个数据表，可以将不同表的数据合并到同一个表中。以下是使用concat()函数的示例：

print(pd.concat([data1, data2], ignore_index=True))

append函数

append()函数用于将一个或多个数据表的数据添加到另一个数据表中。以下是使用append()函数的示例：

g = data1.append({'员工编号':'a005', '员工姓名':'孙七', '员工性别':'男'}, ignore_index=True)print(g)

2. 数据的运算

2.1 数据的统计运算

pandas模块中提供了多种统计函数，如sum()、mean()、max()和min()，可以用于数据表中的数值计算。

data = pd.read_csv('D:\git\python\code\第5章\产品统计表.csv')print(data.sum())print(data['利润(元)'].sum())

2.2 获取数值分布情况

describe()函数可以用来获取数据表中数值数据的分布情况，包括均值、最值、标准差等统计指标。

data.describe()print(data['利润(元)'].describe())

2.3 计算相关系数

corr()函数可以计算数据表中不同列之间的相关系数，用于衡量变量之间的相关性。

data = pd.read_excel('D:\git\python\code\第5章\相关性分析.xlsx')print(data.corr())

2.4 分组汇总数据

groupby()函数可以对数据表进行分组汇总，按指定的分组键对数据进行聚合计算。

data = pd.read_csv('D:\git\python\code\第5章\产品统计表.csv')data.groupby('产品')['数量(个)','利润(元)'].sum()

2.5 创建数据透视表

pivot_table()函数可以用于创建数据透视表，快速对数据表中的数据进行分组和计算。

pd.pivot_table(data, values=['利润(元)', '成本(元)'], index='产品', aggfunc='sum')pd.pivot_table(data, values=['利润(元)', '成本(元)'], index=['产品', '编号'], aggfunc='sum')

转载地址：http://kwjuz.baihongyu.com/

你可能感兴趣的文章