《利用Python进行数据分析》|百度网盘|免费下载

|点击进入百度网盘下载|

提取码:23wm

                                                          本书版权归原文作者所有,如有侵权联系删除

内容简介

还在苦苦寻觅用Python控制、处理、整理、分析结构化数据的完整课程?本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。

由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本书适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。

•将IPython这个交互式Shell作为你的首要开发环境。

•学习NumPy(Numerical Python)的基础和高级知识。

•从pandas库的数据分析工具开始。

•利用高性能工具对数据进行加载、清理、转换、合并以及重塑。

•利用matplotlib创建散点图以及静态或交互式的可视化结果。

•利用pandas的groupby功能对数据集进行切片、切块和汇总操作。

•处理各种各样的时间序列数据。

•通过详细的案例学习如何解决Web分析、社会科学、金融学以及经•济学等领域的问题。

作者简介

Wes McKinney 资深数据分析专家,对各种Python库(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,并在大量的实践中积累了丰富的经验。撰写了大量与Python数据分析相关的经典文章,被各大技术社区争相转载,是Python和开源技术社区公认的权威人物之一。开发了用于数据分析的著名开源Python库——pandas,广获用户好评。在创建Lambda Foundry(一家致力于企业数据分析的公司)之前,他曾是AQR Capital Management的定量分析师。

目录

第1章 准备工作 5

本书主要内容 5

为什么要使用Python进行数据分析 6

重要的Python库 7

安装和设置 10

社区和研讨会 16

使用本书 16

致谢 18

第2章 引言 20

来自bit.ly的1.usa.gov数据 21

MovieLens 1M数据集 29

1880—2010年间全美婴儿姓名 35

小结及展望 47

第3章 IPython:一种交互式计算和开发环境 48

IPython基础 49

内省 51

使用命令历史 60

与操作系统交互 63

软件开发工具 66

IPython HTML Notebook 75

利用IPython提高代码开发效率的几点提示 77

高级IPython功能 79

致谢 81

第4章 NumPy基础:数组和矢量计算 82

NumPy的ndarray:一种多维数组对象 83

通用函数:快速的元素级数组函数 98

利用数组进行数据处理 100

用于数组的文件输入输出 107

线性代数 109

随机数生成 111

范例:随机漫步 112

第5章 pandas入门 115

pandas的数据结构介绍 116

基本功能 126

汇总和计算描述统计 142

处理缺失数据 148

层次化索引 153

其他有关pandas的话题 158

第6章 数据加载、存储与文件格式 162

读写文本格式的数据 162

二进制数据格式 179

使用HTML和Web API 181

使用数据库 182

第7章 数据规整化:清理、转换、合并、重塑 186

合并数据集 186

重塑和轴向旋转 200

数据转换 204

字符串操作 217

示例:USDA食品数据库 224

第8章 绘图和可视化 231

matplotlib API入门 231

pandas中的绘图函数 244

绘制地图:图形化显示海地地震危机数据 254

Python图形化工具生态系统 260

第9章 数据聚合与分组运算 263

GroupBy技术 264

数据聚合 271

分组级运算和转换 276

透视表和交叉表 288

示例:2012联邦选举委员会数据库 291

第10章 时间序列 302

日期和时间数据类型及工具 303

时间序列基础 307

日期的范围、频率以及移动 311

时区处理 317

时期及其算术运算 322

重采样及频率转换 327

时间序列绘图 334

移动窗口函数 337

性能和内存使用方面的注意事项 342

第11章 金融和经济数据应用 344

数据规整化方面的话题 344

分组变换和分析 355

更多示例应用 361

第12章 NumPy高级应用 368

ndarray对象的内部机理 368

高级数组操作 370

广播 378

ufunc高级应用 383

结构化和记录式数组 386

更多有关排序的话题 388

NumPy的matrix类 393

高级数组输入输出 395

性能建议 397

附录A Python语言精要 401

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,542评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,596评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,021评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,682评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,792评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,985评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,107评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,845评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,299评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,612评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,747评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,441评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,072评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,828评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,069评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,545评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,658评论 2 350