数据可视化
《数据可视化之美》
在《数据可视化之美》中,20多位可视化专家包括艺术家、设计师、评论家、科学家、分析师、统计学家等,展示了他们如何在各自的学科领域内开展项目。他们共同展示了可视化所能实现的功能以及如何使用它来改变世界。
数据可视化的书不多。市面上多以编程为主,面向新手和设计的教程寥寥无几。 如果只是了解图表,看Excel的书籍也管用。
分析思维
《金字塔原理》
这是咨询中必看的一本书,是麦肯锡内部的标准,介绍了一个思维模型。
另外麦肯锡相关的书籍还有《麦肯锡意识》《麦肯锡工具》《麦肯锡方法》等。
《精益数据分析》
精益系列的书籍,面向的是互联网的方面,案例大多是欧美的。
《黑天鹅》
塔勒布的力作,讲叙不确定性在我们生活中的作用。他的姊妹篇《黑天鹅的世界》也是这个主题。
《思考的技术》,大前研一的著作,也是咨询类经典。如果对咨询向的分析感兴趣,还可以看BCG系列,或者刷CaseBook。
《批判性思维》,则是教你如何形成理性思维。
SQL
《SQL学习指南》
这本书详细介绍了SQL的应用,主要使用的案例是MYSQL。特别适合初学者入门而且进阶。
统计学
这个主题看几本教科书都是可以的,比如
《理工科概论论和数理统计》
介绍理论
《机器学习系统设计》
介绍了常见的机器学习模型,并且使用Python实现。
如果想看看机器学习的理论的话可以看看
《统计学习方法》,《统计学习基础》,当然这两本书理论性比较强。
业务
《增长黑客》
增长黑客的概念就是随着这本书的畅销传播开来。增长黑客在国内即是数据分析+运营产品的复合型人才。这本书好的地方在于拓展思路,告诉我们数据能够做什么,尤其是连AB测试都不清楚的新人。
《数据挖掘与数据化运营实战》
这本书涉及了数据挖掘,但是比较浅,可以作为数据分析师视野的承上启下,了解数据化运营的高级应用。特点是以阿里的实际工作相结合,可又因为保密原则不够详尽。
《数据实践之美》
这本书是由各领域专家众筹完成,比起传统的书籍,囊括范围更广。虽然没有深度讲解技术,但是各领域的案例都是一手资料,对业务的触类旁通理解有帮助。
Python
《Python学习手册》
对于拥有编程基础的人,这本书系无巨细的有些啰嗦,不过对新人,可以避免不必要的坑,非常好的一本书。把它当作一本工具文档吧,当遇到不理解的内容随时翻阅。
《利用Python进行数据分析》
pandas官方出品,pandas作者亲笔写作。虽然书有点老了,但还是可以运行,有很多Pandas函数已经有更优雅的写法了,例如df.query。每段代码都敲打一遍,千万行的数据清洗基本不会有大问题了。
《Python cookbook》
Python的进阶书,如果想要掌握更好的编程能力,这是一本经典,值得时时翻阅。注意,它更偏向程序员。
《数学之美》
吴军的力作,介绍了多个数学模型,用几个简单的公式就讲清楚了。包括用于搜索引擎,自然语言处理等的应用。
《集体智慧编程》
一本比较老的书了,讲了一些利用统计,大样本来工作的例子。如协同过滤,pagerank算法,遗传编程等。
大数据
《Spark快速大数据分析》
Spark的入门书,清楚了讲解了Spark的编程模型,一些使用案例,是入门的好书。
《Spark高级大数据分析》
一些数据科学家的案例分析,也可以作为业务的实践。
《Spark企业级实战》
分析Spark源码
《YARN权威指南》
新的Hadoop大数据基础设施,介绍了YARN的架构,配置,Mapreduce的编程模型。
《Spark机器学习》
介绍了Spark中集成的机器学习类,利用案例进行讲解。
推荐进阶书请留言。