作者:乔山办公网日期:
返回目录:excel表格制作
zip函数接受任意多个(包括0个和1个)序列作为知参数,道返回一个tuple列表。具体意思不好用文字来表述,直接看示例:回
a = [100, 200, 300]
b = [400, 500, 600]
c = [700, 800, 900]
abc = zip(a, b, c)
print(xyz)
结果是:[(100, 400, 700), (200, 500, 800), (300, 600, 900)]
所以对答Series组合成DataFrame用zip函数就可以,代码示例:
DataFrame(list(zip(a, b)))
结果演示:
Excel是数据分钟中最常用的工具,通过Python和Excel功能对比,zhidao介绍如何使用Python通过函数式编程完成Excel中的数据处理及分析工作。
在Python中pandas库用于数据处理,我们从1787页的pandas官网文档中总结出最常用的36个函数,版通过这些函数介绍如何通过Python完成数据生成和导入,数据清洗,预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作。
第7章 数据汇总本章主要讲解如何对数据进权行分类汇总。Excel中使用分类汇总和数据透视可以按特定维度对数据进行汇总;Python中使用的主要函数是groupby和pivot_table.
python有分层索引,一个列里面可以多个列
1、Series的创建7a64e58685e5aeb9364
序列的创建主要有三种方式:
1)通过一维数组创建序列
import numpy as np, pandas as pd
arr1 = np.arange(10)
arr1
type(arr1)
s1 = pd.Series(arr1)
s1
type(s1)
2)通过字典的方式创建序列
dic1 = {'a':10,'b':20,'c':30,'d':40,'e':50}
dic1
type(dic1)
s2 = pd.Series(dic1)
s2
type(s2)
3)通过DataFrame中的某一行或某一列创建序列
这部分内容我们放在后面讲,因为下面就开始将DataFrame的创建。
2、DataFrame的创建
数据框的创建主要有三种方式:
1)通过二维数组创建数据框
arr2 = np.array(np.arange(12)).reshape(4,3)
arr2
type(arr2)
df1 = pd.DataFrame(arr2)
df1
type(df1)
2)通过字典的方式创建数据框
以下以两种字典来创建数据框,一个是字典列表,一个是嵌套字典。
dic2 = {'a':[1,2,3,4],'b':[5,6,7,8],
'c':[9,10,11,12],'d':[13,14,15,16]}
dic2
type(dic2)
df2 = pd.DataFrame(dic2)
df2
type(df2)