本文共 1676 字,大约阅读时间需要 5 分钟。
在pandas中,使用T方法可以将数据表的行和列进行转置。以下示例展示了如何将数据表的列转化为行标签。
import pandas as pddata = pd.read_csv('D:\git\python\code\第5章\产品统计表.csv')a = data.Tprint(a) 将数据表转换为树形结构可以通过stack()方法实现,这样可以将数据表的列标签也转化为行标签,形成层次化的数据结构。
data = pd.read_excel('D:\git\python\code\第5章\产品统计表3.xlsx')print(data.stack()) 数据表的拼接是指将两个或多个数据表合并为一个数据表。在pandas中可以使用merge()、concat()和append()函数来实现不同的拼接方式。
merge()函数用于按键合并两个数据表。以下是使用merge()函数的示例:
data1 = pd.read_excel('D:\git\python\code\第5章\产品表.xlsx', sheet_name=0)data2 = pd.read_excel('D:\git\python\code\第5章\产品表.xlsx', sheet_name=1)print(pd.merge(data1, data2)) concat()函数用于全连接两个或多个数据表,可以将不同表的数据合并到同一个表中。以下是使用concat()函数的示例:
print(pd.concat([data1, data2], ignore_index=True))
append()函数用于将一个或多个数据表的数据添加到另一个数据表中。以下是使用append()函数的示例:
g = data1.append({'员工编号':'a005', '员工姓名':'孙七', '员工性别':'男'}, ignore_index=True)print(g) pandas模块中提供了多种统计函数,如sum()、mean()、max()和min(),可以用于数据表中的数值计算。
data = pd.read_csv('D:\git\python\code\第5章\产品统计表.csv')print(data.sum())print(data['利润(元)'].sum()) describe()函数可以用来获取数据表中数值数据的分布情况,包括均值、最值、标准差等统计指标。
data.describe()print(data['利润(元)'].describe())
corr()函数可以计算数据表中不同列之间的相关系数,用于衡量变量之间的相关性。
data = pd.read_excel('D:\git\python\code\第5章\相关性分析.xlsx')print(data.corr()) groupby()函数可以对数据表进行分组汇总,按指定的分组键对数据进行聚合计算。
data = pd.read_csv('D:\git\python\code\第5章\产品统计表.csv')data.groupby('产品')['数量(个)','利润(元)'].sum() pivot_table()函数可以用于创建数据透视表,快速对数据表中的数据进行分组和计算。
pd.pivot_table(data, values=['利润(元)', '成本(元)'], index='产品', aggfunc='sum')pd.pivot_table(data, values=['利润(元)', '成本(元)'], index=['产品', '编号'], aggfunc='sum')
转载地址:http://kwjuz.baihongyu.com/