在更新pandas文章前,先跟大家谈谈
一.数据分析师做什么?
对于想转行或刚入门的同学来讲,对数据分析啥的概念还比较模糊,基于本人工作2.5年的经验,我谈谈我对数据分析师的认知,希望能帮到即将踏入或准备踏入本行的人。
数据分析师字面解析,数据 + 分析 得出 师(诗)。无非就是1.获取数据 2.用统计方法分析数据 3.将数据所包含有价值的信息抽取出来,以简单的方式表达出来;从而反应出真实的业务问题,近而支持业务决策;
当然说起来也有这么些个字,做起来可不是那么容易的,经常找不到结果,抽取不出有价值的信息,所以说数据狗呀,绞尽脑汁地想想想。。。数据验证。。。想想想。。。验证。。。
二.数据分析师用到哪些工具?
数据分析最最重要的一步就是准确get到数据,注意一定要准确,不然后面的分析都白忙活。那么问题来了,用到哪些工具?工作2.5年以来,使用最多的是SQL、 Python、Excel,偶尔用下SPSS。
从当下数据分析师岗位招聘来看,无非就是SQL、Python或R或SAS、Excel等。所以至少得会Python或R或SAS中的一种,此系列文章就针对Python工具
三.初识python&pandas
如果大家想了解python的优缺点直接百度python就能有一堆,自认为不会比他们说的更好,就不废话了。只想说的是python作为数据分析工具,能这么好用,这么广受喜爱,多得益于pandas、matplotlib和ggplot,前者是数据处理,后2者是画图。在这里我只给大家分享pandas在工作中的应用,在应用场景中学习并掌握pandas。
四.关于系列文章更新
1.就这样产生了分享pandas的想法,希望能帮助入门的小菜鸟应用pandas处理数据
2.多次面试,发现很多人想正在往数据分析职业转型,但多数还不会python工具;
3.我此番更新系列文章,仅对入门的同学有帮助,如果已是大牛就不必浪费时间了;
4.此系列文章记录的是我工作中常用的及常遇到的bug解决;一是作为自己学习的成 果,二是希望入门的人也能少走弯路;只有干货,实实在在的干货。
5.另外,我用的是anaconda软件写python3,附上下载地址: https://www.anaconda.com/download/
6.文章周末更新(每周更新一篇,更新内容可根据大家的需求变动);
7.本周末会更新第一篇pandas内容 ,只要有人需要便会持续更新