2021-07-30

第五节 Pandas高级数据结构

一、 Pandas介绍与安装

1.1 为什么会有Pandas?

Pandas支持大部分Numpy语言风格,尤其是数组函数与广播机制的各种数据处理。但是Numpy更适合处理同质型的数据。而Pandas的设计就是用来处理表格型或异质型数据的,高效的清洗、处理数据。

1.2 Pandas是什么?

Pandas是基于Numpy的一种工具,提供了高性能矩阵的运算,该工具是为了解决数据分析任务而创建的。也是贯穿整个Python数据分析非常核心的工具。

1.3 Pandas涉及内容

image.png

1.4 Pandas安装

直接在dos命令行中pip install pandas 即可。

二、 Pandas数据结构介绍

2.1 Series

2.1.1 Series介绍

Series是一种一维的数组型对象,它包含了一个值序列(values),并且包含了数据标签,称为索引(index)。

2.1.2 Series创建

  • pd.Series(data=None,index=None,dtype=None,name=None,copy=False)
    data:创建数组的数据,可为array-like, dict, or scalar value
    index:指定索引
    dtype:数组数据类型
    name:数组名称
    copy:是否拷贝

2.1.3 创建方式

  • 通过列表创建 s = pd.Series([1,2,3])


    image.png
  • 通过元组创建 s1 = pd.Series((1,2,3))


    image.png
  • 通过数组创建


    image.png
  • 通过字典创建


    image.png

2.1.4 Series简单使用

  • series的索引与值
image.png

image.png

image.png
  • s.index 查看索引


    image.png
  • s.values 查看值序列


    image.png
  • s.reset_index(drop=False) 重置索引
    drop # 是否删除原索引 默认为否

注意:索引对象是不可变的,所以不能单个修改索引

  • 切片:下标切片是左闭右开,标签切片是包含右边的标签值


    image.png

    image.png
  • Series索引与切片
    s['标签'] # 通过标签
    s['索引'] # 通过索引
    s.loc(标签) # 通过标签
    s.iloc(索引) # 通过索引

  • Series简单函数

s3.isnull() # 检查缺失值


image.png

s.head(n) # 预览数据前5条


image.png

s.dtype # 查看数据类型
s.astype() # 修改数据类型


image.png

s.tail(n) # 预览数据后5条


image.png

2.2 DataFrame 表格型数据结构

2.2.1 DataFrame介绍

DataFrame表示的是矩阵的数据表,它包含已排序的列集合,每一列可以是不同的值类型(数值,字符串,布尔值)。在DataFrame中,数据被存储为一个以上的二维块。

2.2.2 DataFrame创建

pd.DataFrame(data=None,index=None,columns=None,dtype=None,copy=False)
data:创建数组的数据,可为ndarray, dict
index:指定索引
dtype:数组数据类型
copy:是否拷贝

2.2.3 创建方式一: 字典类

  • 数组,列表,或者元组构成的字典构造dataframe


    image.png

    index属性:行索引,列索引


    image.png

    可以指定行索引和列索引
    image.png
  • series组成字典构造dataframe


    image.png
  • 字典组成字典构造dataframe


    image.png

2.2.4 创建方式二: 列表类

  • 二维数组构造dataframe


    image.png
  • 字典构造列表构造dataframe


    image.png
  • series组成的列表构造dataframe


    image.png

2.2.5 补充创建描述

image.png

2.2.6 基本操作

  • 索引查询


    image.png

    image.png
  • 通过索引改行列、增行列数据


    image.png
  • 删除行列


    image.png
  • 一般使用drop删除行列,axis=0指定所在的行列,inplace是否有返回值,默认在原数据修改

image.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,163评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,301评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,089评论 0 352
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,093评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,110评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,079评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,005评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,840评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,278评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,497评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,394评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,980评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,628评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,649评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,548评论 2 352

推荐阅读更多精彩内容

  • 导入pandasimport pandas as pd Pandas的数据结构 1.Series Series是一...
    Lipai阅读 360评论 0 0
  • 一、mysql: 1.1深入浅出: 数据分析的典型四步骤:确定问题(心智模型 )→分解问题→评估数据→做出决策(C...
    X_Ran_0a11阅读 468评论 0 1
  • Pandas 目录一、Pandas基础二、Pandas三大数据结构1.Series2.DataFrame3.Ind...
    Recalcitrant阅读 2,048评论 0 11
  • MYSQL GROUP_CONCAT函数 lconcise[//www.greatytc.com/u/c...
    wings_d35e阅读 135评论 0 0
  • Jupyter Notebook 利器 入门基础 windows一键安装:3.5.2版本第三方包:windows平...
    Babus阅读 1,797评论 0 1