Pandas入门
大家好,我是Peter~
最近小编将自己写作的Pandas系列的入门文章浓缩成了一份简单的PPT。PPT的内容主要是介绍了Pandas的常见数据结构,以及高频的函数:
- Pandas的两种数据结构
- 11种方式创建DataFrame
- DataFrame取数技巧
- 数据处理基石:Pandas数据探索
- Pandas数据类型
- Pandas重点机制:groupby、rank、sort_values
- Pandas缺失值、重复值处理
- Pandas数据合并:merge、concat
- 轴旋转操作:unstack和stack
- Pandas透视表
一份简单的PPT,希望对学习Pandas的朋友有所帮助。文末有PPT的具体获取方式
PPT内容
两大数据结构
Pandas中主要是有两大数据结构:Series和DataFrame。
- Series数据:由name、index、values组成
- DataFrame数据:可以看成是多个Series数据组成
Pandas的数据处理更多情况下是和DataFrame打交道。在下面的导图中,重点介绍了如何通过11种不同的方式来生成DataFrame类型的数据。
在我们拿到了一份数据之后,读取成为DataFrame后,需要找到我们需要的数据。如何查看或者找到我们想要的数据呢?下面是介绍了各种方法来取数,大致可以分为:
- 表达式取数
- 索引/属性取数
- 切片取数
- 使用函数取数等
有了一份数据,在处理之前我们必须查看这个数据一些基本信息:数据的大小、维度、字段类型、缺失值情况等,我们把这项工作称之为:数据探索
在下面的内容中将pandas、python原生、numpy的3种不同数据类型进行了比较:
在下面的几页PPT中,介绍了Pandas高频使用的函数:groupby、rank、sort_values、drop_duplicated、merge、concat等。它们主要是应用在数据的预处理、数据合并、数据去重、透视表的制作等方面
获取方式
关注【尤而小屋】,回复:熊猫即可